Machine Translation of Sentences with Fixed Patterns

Bibliographic Information

Other Title
  • 定型パターンを含む文の機械翻訳手法
  • 自然言語処理

Search this article

Description

外電を対象とした、英日機械翻訳システムの研究を進めている。外電ニュースは政治、経済、スポーツ等多岐の分野にわたっており、使われる表現も様々である。しかし、経済ニュースのように定型表現が多い分野も多い。定型表現によって、経済ニュースは文型に独特な特徴があり、訳語も独特の表現が要求されるので、従来のような解析一変換一生成という機械翻訳では処理が困難である。むしろ、定型表現を積極的に利用して、特別な方法で翻訳処理するほうが精度の向上を期待できる。本論文では、定型表現を多く含む文(定型文)を精度よく翻訳処理する手法について述べる。本手法では、定型文を翻訳する際に、定型文翻訳データ(FSTデータ)が重要な役割を果たす。FSTデータは、定型文の英単語列を記述した文脈自由文法のルールと日本語テンプレートから成り、定型文とその対訳から自動的に作成される。その定型文は、含有率を計算することにより大規模コーパスから自動的に抽出される。本手法によって、外電経済ニュースを対象とした定型文翻訳実験を行った緒果、翻訳率が従来の我々のシステムより約10%向上した。

Journal

Citations (2)*help

See more

References(19)*help

See more

Keywords

Details 詳細情報について

Report a problem

Back to top