談話構造に基づく語彙選択を行うXMLデータベースからのテキスト生成

書誌事項

タイトル別名
  • ダンワ コウゾウ ニ モトヅク ゴイ センタク オ オコナウ XML データベース カラ ノ テキスト セイセイ
  • Text Generation from XML-DB with Lexical Selection Based on Discourse Structure
  • 自然言語

この論文をさがす

抄録

本論文は,データベースからの報告書の生成というテーマに関して新たな実現方法を提案するものである.我々は,XML変換に基づく日本語と英語およびフランス語とドイツ語の天気予報を出力する自然言語生成システムを,標準的な3段階パイプライン方式に基づいて実現した.人が作成するようなテキストを計算機が生成するためには,結束性の概念を考慮したうえで個々の文の構造を決定しなければならない.本論文において,DOM,SAX,XSLTなどのXMLの標準的な技術を使用することによって,談話単位ごとの局所的な制約に基づいて表層文を実現する方法について提案する.また,日本語と英語およびフランス語とドイツ語の4つの言語のテキスト生成を対象とすることによって,ドメインを対象とした伝達意図に基づく談話の構造の選択と,個別の出力言語に依存する談話中の個々の文の構造および表層語彙の選択との境界線を明確に示した.

The purpose of this study is to propose a new method for the generation of reports from databases. We implemented an XML transformation-based natural language generation system for Japanese, English, French, and German weather forecast by using a three-stage pipeline architecture. In order to generate human-like texts, we must determine individual sentence structures by considering the concept of ``cohesion''. In this paper, we propose the method on how to realize surface sentences with local lexical constraints on discourse segment by using DOM, SAX, and, XSLT technique. We regard this process as text generation based on intentional structure to retrieve information from databases, and make a distinction between the selectional process of intentional strucuture based on domain knowledge and of linguistic structure by producing four language texts.

収録刊行物

参考文献 (16)*注記

もっと見る

キーワード

詳細情報 詳細情報について

問題の指摘

ページトップへ