アスペクト被覆を可能にした最小値最大化問題に基づく文書要約モデル
書誌事項
- タイトル別名
-
- Balanced Coverage of Aspects for Text Summarization
- 公開日
- 2011-11-14
この論文をさがす
説明
本稿では複数のアスペクトを網羅的に被覆した要約の生成を最小値最大化問題として実現する手法を提案する.アスペクトは,読者が元の文書の内容を知るために重要な項目であり,予め定義されている.例えば文書クラスタのトピックが事故や天災であれば,アスペクトは"原因"や"被害"などがある.この複数のアスペクトを被覆することで全体的な内容を要約という形で読者に提示することが本稿の目的である.各アスペクトを捉えるために,我々は最大エントロピー分類器を用いた.我々のモデルは,最大エントロピー分類器の予測結果をアスペクトの反映度と考えて最小値最大化問題を解く.アスペクトの反映度のうち,最も小さな反映度を最大化するように要約を生成するため,要約は網羅的にアスペクトを被覆する.アスペクトが定義されている要約タスクにおいて,アスペクトを明示的に考慮することで,要約で一般的に重要な要素のみを考えたモデルよりもROUGE-2が向上することを示す.We present a new text summarization model based on max-min problem to cover aspects. Aspects are pre-defined for each category of source documents; for example, the category Accidents and Natural disasters has aspects such as WHY and DAMAGES. Our goal is to generate a summary that covers these aspects. In order to calculate the score indicating the aspect coverage, we use the maximum-entropy classifier that predicts whether each sentence reflects the aspect or not. In our model, the score indicating the coverage for each aspect is calculated and the minimum of the scores of the aspects is going to be maximized so that the summary contains all the aspects. Through the summarization experiments on the TAC dataset, we show that our model outperforms a state-of-the-art summarization system in terms of ROUGE-2.
収録刊行物
-
- 研究報告自然言語処理(NL)
-
研究報告自然言語処理(NL) 2011 (9), 1-7, 2011-11-14
- Tweet
詳細情報 詳細情報について
-
- CRID
- 1572261551925421952
-
- NII論文ID
- 110008712235
-
- NII書誌ID
- AN10115061
-
- 本文言語コード
- ja
-
- データソース種別
-
- CiNii Articles