ドメイン非依存な対話戦略を備えた情報検索音声対話システム(自然言語)(<特集>人工知能分野における博士論文)
-
- 駒谷 和範
- 京都大学大学院情報学研究科 (現)京都大学大学院情報学研究科知能情報学専攻
書誌事項
- タイトル別名
-
- Spoken Dialogue Systems for Information Retrieval with Domain-Independent Dialogue Strategies(Natural Language Processing)(<Special Issue>Doctorial Theses on Aritifical Intelligence)
この論文をさがす
説明
<p>本論文は,情報検索を行う音声対話システムにおける柔軟な対話戦略に関して述べたものである.音声対話システムでは,本質的に音声認識誤りが避けられない.また多数の検索結果をすべてユーザに提示するのは冗長であるため,検索結果の絞込みも重要となる.これらへの対処として,システムからの確認や質問は有効だが,冗長な確認や質問は快適な対話を阻害する.したがって,適切な応答を行う対話戦略が必須である.さらに,このような対話戦略はドメイン非依存であることが望ましい.つまり,当該ドメインの対話フローをすべて人手で用意するのではなく,音声認識結果や検索結果に基づいて規定していれば,異なるドメインにも汎用に適用できる.第2章では,談話タグの一つである発話単位タグを,発話の表層的な特徴と発話間のやり取り構造に注目して自動推定した.第3章では,言語モデルの作成に焦点をおいて,ドメインに依存しない音声対話システムの構築を行った.ドメインに依存するキーフレーズ部分の文法と,類似タスクドメインの統計的言語モデルをともに用いて,柔軟な言語制約を実現した.第4章では音声認識誤りへの対処として,音声認識結果の信頼度を用いた効率の良い確認や誘導を提案した.信頼度を単語とカテゴリーの2レベルで計算し,確認を制御するとともに,内容語がうまく認識できない場合でもカテゴリーレベルの誘導を適切に行う.第5章では,ドメイン知識の構造や文書の頻度分布を用いることで,検索結果を効率良く絞り込む質問の生成を行った.機器操作マニュアルの階層構造を利用し,コスト関数を導入して最適な質問を選ぶことで,平均対話ターン数を約30%削減した.</p>
収録刊行物
-
- 人工知能
-
人工知能 19 (1), 104_2-104_2, 2004-01-01
一般社団法人 人工知能学会
- Tweet
詳細情報 詳細情報について
-
- CRID
- 1390285697603106560
-
- NII論文ID
- 110002809163
-
- NII書誌ID
- AN10067140
-
- ISSN
- 24358614
- 21882266
-
- 本文言語コード
- ja
-
- データソース種別
-
- JaLC
- CiNii Articles
-
- 抄録ライセンスフラグ
- 使用不可