語順の相関に基づく機械翻訳の自動評価法

平尾 努, 磯崎 秀樹, 須藤 克仁, Duh Kevin, 塚田 元, 永田 昌明

doi:10.5715/jnlp.21.421

書誌事項

タイトル別名

Evaluating Translation Quality with Word Order Correlations
ゴジュンノソウカンニモトズクキカイホンヤクノジドウヒョウカホウ

この論文をさがす

抄録

効率的に機械翻訳システムを開発していくためには，質の高い自動評価法が必要となる．これまでに様々な自動評価法が提案されてきたが，参照翻訳とシステム翻訳との間で一致する N グラムの割合に基づきスコアを決定する BLEU や最大共通部分単語列の割合に基づきスコアを決定する ROUGE-L などがよく用いられてきた．しかし，こうした方法にはいつくかの問題がある．ルールベース翻訳 (RBMT) の訳を人間は高く評価するが，従来の自動評価法は低く評価する．これは，RBMT が参照翻訳と違う訳語を使うことが多いのが原因である．これら従来の自動評価法は単語が一致しないと大きくスコアが下がるが，人間はそうとは限らない．一方，統計的機械翻訳 (SMT) で英日，日英翻訳を行うと，「A なので B」と訳すべきところを「B なので A」と訳されがちである．この訳には低いスコアが与えられるべきであるが，N グラムの一致割合に着目するとあまりスコアは下がらない．こうした問題を解決するため，本稿では，訳語の違いに寛大で，かつ，大局的な語順を考慮した自動評価法を提案する．大局的な語順は順位相関係数で測定し，訳語の違いは，単語適合率で測定するがパラメタでその重みを調整できるようにする．NTCIR-7，NTCIR-9 の特許翻訳タスクにおける英日，日英翻訳のデータを用いてメタ評価を行ったところ，提案手法が従来の自動評価法よりも優れていることを確認した．

収録刊行物

自然言語処理

自然言語処理 21 (3), 421-444, 2014

一般社団法人　言語処理学会

キーワード

詳細情報詳細情報について

CRID: 1390001204474267776

NII論文ID: 130004691832

NII書誌ID: AN10472659

DOI: 10.5715/jnlp.21.421

ISSN: 21858314; 13407619

NDL書誌ID: 025606780

Web Site: https://ndlsearch.ndl.go.jp/books/R000000004-I025606780; https://www.jstage.jst.go.jp/article/jnlp/21/3/21_421/_pdf

本文言語コード: ja

データソース種別

JaLC
NDL
Crossref
CiNii Articles

抄録ライセンスフラグ: 使用不可

語順の相関に基づく機械翻訳の自動評価法

書誌事項

この論文をさがす

抄録

収録刊行物

被引用文献 (1)*注記

参考文献 (4)*注記

キーワード

詳細情報詳細情報について

書き出し

問題の指摘

語順の相関に基づく機械翻訳の自動評価法

書誌事項

この論文をさがす

抄録

収録刊行物

被引用文献 (1)*注記

参考文献 (4)*注記

キーワード

詳細情報 詳細情報について

書き出し

問題の指摘

参加プロジェクトリスト

詳細情報詳細情報について