文レベルの機械翻訳評価尺度に関する調査
-
- Graham Neubig
- 奈良先端科学技術大学院大学情報科学研究科
この論文をさがす
説明
本研究では,近年提案されている機械翻訳の自動評価尺度を翻訳文品質の判定能力の観点から調査する.具体的には,日英,英日,仏英翻訳の計 4 タスクにおいて,4 つのシステムの出力に対して人手評価を行い,その結果に基づいて,5 種類の自動評価尺度を分析する.最初の実験では,人手による誤り分析を行う前段階として,自動評価尺度を用いて誤り文を特定する可能性について調査する.次の実験では,システム統合などで必要となる複数のシステムによる翻訳候補の優劣判定能力について調査する.両方の調査の結果,すべての自動評価尺度は,別の評価者による人手評価から得られるアノテータ間一致を大幅に下回っており,文レベルの自動翻訳評価に大きな課題が残っていることが分かった.しかし,複数の参照文を用いることにより翻訳品質判定能力が文レベルでも向上する結果も見られた.
収録刊行物
-
- 情報処理学会研究報告. 自然言語処理研究会報告
-
情報処理学会研究報告. 自然言語処理研究会報告 2013 (7), 1-8, 2013-07-11
一般社団法人情報処理学会
- Tweet
キーワード
詳細情報 詳細情報について
-
- CRID
- 1574231877625660544
-
- NII論文ID
- 110009586058
-
- NII書誌ID
- AN10115061
-
- 本文言語コード
- ja
-
- データソース種別
-
- CiNii Articles