語順の相関に基づく機械翻訳の自動評価法

  • 平尾 努
    日本電信電話株式会社 NTT コミュニケーション科学基礎研究所
  • 磯崎 秀樹
    岡山県立大学
  • 須藤 克仁
    日本電信電話株式会社 NTT コミュニケーション科学基礎研究所
  • Duh Kevin
    奈良先端科学技術大学院大学
  • 塚田 元
    日本電信電話株式会社 NTT コミュニケーション科学基礎研究所
  • 永田 昌明
    日本電信電話株式会社 NTT コミュニケーション科学基礎研究所

書誌事項

タイトル別名
  • Evaluating Translation Quality with Word Order Correlations
  • ゴジュン ノ ソウカン ニ モトズク キカイ ホンヤク ノ ジドウ ヒョウカホウ

この論文をさがす

抄録

効率的に機械翻訳システムを開発していくためには,質の高い自動評価法が必要となる.これまでに様々な自動評価法が提案されてきたが,参照翻訳とシステム翻訳との間で一致する N グラムの割合に基づきスコアを決定する BLEU や最大共通部分単語列の割合に基づきスコアを決定する ROUGE-L などがよく用いられてきた.しかし,こうした方法にはいつくかの問題がある.ルールベース翻訳 (RBMT) の訳を人間は高く評価するが,従来の自動評価法は低く評価する.これは,RBMT が参照翻訳と違う訳語を使うことが多いのが原因である.これら従来の自動評価法は単語が一致しないと大きくスコアが下がるが,人間はそうとは限らない.一方,統計的機械翻訳 (SMT) で英日,日英翻訳を行うと,「A なので B」と訳すべきところを「B なので A」と訳されがちである.この訳には低いスコアが与えられるべきであるが,N グラムの一致割合に着目するとあまりスコアは下がらない.こうした問題を解決するため,本稿では,訳語の違いに寛大で,かつ,大局的な語順を考慮した自動評価法を提案する.大局的な語順は順位相関係数で測定し,訳語の違いは,単語適合率で測定するがパラメタでその重みを調整できるようにする.NTCIR-7,NTCIR-9 の特許翻訳タスクにおける英日,日英翻訳のデータを用いてメタ評価を行ったところ,提案手法が従来の自動評価法よりも優れていることを確認した.

収録刊行物

  • 自然言語処理

    自然言語処理 21 (3), 421-444, 2014

    一般社団法人 言語処理学会

被引用文献 (1)*注記

もっと見る

参考文献 (4)*注記

もっと見る

詳細情報 詳細情報について

問題の指摘

ページトップへ