単語アライメントを用いた英日機械翻訳文の流暢さの自動評価

書誌事項

タイトル別名
  • Automatic Evaluation of the Fluency of English-to-Japanese Machine Translation Using Word Alignment
  • タンゴ アライメント オ モチイタ エイニチ キカイ ホンヤクブン ノ リュウチョウサ ノ ジドウ ヒョウカ

この論文をさがす

抄録

本稿では,人間による翻訳(人間訳)と機械翻訳システムによる翻訳(システム訳)を訓練事例とした機械学習によって構築した識別器を用いてシステム訳の流暢さを自動評価する手法について述べる.提案手法では,人間訳とシステム訳の流暢さの違いを表わす手がかりとして,逐語訳(原文と翻訳文での単語同士の対応)に着目した.人間訳とシステム訳における逐語訳の違いを捉えるために,原文と人間訳との間,および原文とシステム訳との間で単語対応付けを行ない,その結果を機械学習のための素性とする.提案手法は,識別器を構築する際に対訳コーパスを必要とするが,評価対象のシステム訳の流暢さを評価する際には参照訳を必要としない.さらに,大量の訓練事例に人手で流暢さの評価値を付与する必要もない.検証実験の結果,提案手法によってシステムレベルでの自動評価が可能であることが示唆された.また,サポートベクターマシンによる機械学習で各素性に付与される重みに基づいてシステム訳に特徴的な素性を特定できるため,このような素性を含む文を観察することによって文レベルでのシステム訳の特徴分析を行なうこともできる.

収録刊行物

  • 自然言語処理

    自然言語処理 17 (1), 7-28, 2010

    一般社団法人 言語処理学会

参考文献 (21)*注記

もっと見る

関連プロジェクト

もっと見る

詳細情報 詳細情報について

問題の指摘

ページトップへ