言語横断検索・リランキングに基づく目的言語翻訳メモリ利用型NMT
書誌事項
- タイトル別名
-
- NMT utilizing Target Language Monolingual Translation Memory based on Cross-lingual Retrieval of Similar Translations and Reranking
抄録
Hossainらが提案したretrieve-edit-rerank方式は,翻訳や要約において,(1)外部情報から類似事例を検索し,(2)ニューラルモデルにより出力候補文を生成,(3)リランキング・スコアによって最良の出力候補文を自動選択する枠組みである.本論文では,類似目的言語文を用いた翻訳メモリ利用型NMTのタスクにおいて,このretrieve-edit-rerank方式の枠組みに基づき,類似目的言語文を言語横断検索するとともに,最良訳をリランキングする手法を提案する.類似目的言語文の言語横断検索においては,mSBERTやLaBSEを用いて生成した言語に依存しない文埋め込みに基づいて,入力原言語文と類似する目的言語文を直接言語横断検索する.この方式によって,編集距離を用いて同一言語の類似文を検索しその訳文を利用する方式の翻訳精度を有意に改善することを示す.また,文長で正規化した訳文の対数ゆう度と,文埋め込みに基づく入力原言語文・出力候補文間の類似度を併用したリランキング・スコアによる最良訳自動選択により,ベースラインの翻訳精度を有意に改善することを示す.
収録刊行物
-
- 電子情報通信学会論文誌D 情報・システム
-
電子情報通信学会論文誌D 情報・システム J107-D (4), 243-254, 2024-04-01
The Institute of Electronics, Information and Communication Engineers
- Tweet
詳細情報 詳細情報について
-
- CRID
- 1390862545803303296
-
- ISSN
- 18810225
- 18804535
-
- 本文言語コード
- ja
-
- データソース種別
-
- JaLC
-
- 抄録ライセンスフラグ
- 使用不可