AdaBoost/LogitBoost によるWhy テキストセグメント判定と回答抽出の自動化

書誌事項

タイトル別名
  • AdaBoost/LogitBoost ニ ヨル Why テキストセグメント ハンテイ ト カイトウ チュウシュツ ノ ジドウカ
  • Automatic Why Text Segment Classification and Answer Extraction by Machine Learning
  • 自然言語

この論文をさがす

抄録

従来の質問応答システムは,What,Where,Who を扱った質問に対して,事実に関係する回答を行う研究,つまりFactoid 型質問応答システムが主流である.“~はなぜ?” のように原因を求めるWhy 型や,“どのように~できる?” のような方法を探究するHow 型の質問に対応した研究例は多いとはいえない.そこで,本研究では,インターネット上にあるテキスト文書中のテキストセグメントのWhy 判定と,セグメント内の事実文と理由文の位置関係によりCase に分けた回答文の特定を,機械学習によって自動的に行う方法を提案する.Why 判定ではF 値約80%で判別可能となった.回答部分の抽出でも各クラスのF 値を向上させることができた.

Typical question-answering systems deal with factoid types, such as ‘what’, ‘where’, and ‘who’. These types of QA systems are concerned mainly with finding facts from corpus, and are thus unable to answer questions asking for reasons for some events or things. This paper presents the algorithm to find ‘Why-based’ answers from the internet. The main focus of this paper is to classify Why-based text segments and extractWhy-based answers from the segment with Cases, which are differentiated automatically by the position of the fact and reason sentence within a segment, using machine learning. The experiment showed improvement on differentiating Why-based segments from text. Also, this method enabled enhancement of F-measurement of answer extraction.

収録刊行物

被引用文献 (1)*注記

もっと見る

関連プロジェクト

もっと見る

キーワード

詳細情報 詳細情報について

問題の指摘

ページトップへ