言語横断検索・リランキングに基づく目的言語翻訳メモリ利用型NMT

田村 拓也, 王 小天, 宇津呂 武仁, 永田 昌明

doi:10.14923/transinfj.2023pdp0017

書誌事項

タイトル別名

NMT utilizing Target Language Monolingual Translation Memory based on Cross-lingual Retrieval of Similar Translations and Reranking

抄録

Hossainらが提案したretrieve-edit-rerank方式は，翻訳や要約において，(1)外部情報から類似事例を検索し，(2)ニューラルモデルにより出力候補文を生成，(3)リランキング・スコアによって最良の出力候補文を自動選択する枠組みである．本論文では，類似目的言語文を用いた翻訳メモリ利用型NMTのタスクにおいて，このretrieve-edit-rerank方式の枠組みに基づき，類似目的言語文を言語横断検索するとともに，最良訳をリランキングする手法を提案する．類似目的言語文の言語横断検索においては，mSBERTやLaBSEを用いて生成した言語に依存しない文埋め込みに基づいて，入力原言語文と類似する目的言語文を直接言語横断検索する．この方式によって，編集距離を用いて同一言語の類似文を検索しその訳文を利用する方式の翻訳精度を有意に改善することを示す．また，文長で正規化した訳文の対数ゆう度と，文埋め込みに基づく入力原言語文・出力候補文間の類似度を併用したリランキング・スコアによる最良訳自動選択により，ベースラインの翻訳精度を有意に改善することを示す．

収録刊行物

電子情報通信学会論文誌D 情報・システム

電子情報通信学会論文誌D 情報・システム J107-D (4), 243-254, 2024-04-01

The Institute of Electronics, Information and Communication Engineers

キーワード

詳細情報詳細情報について

CRID: 1390862545803303296

DOI: 10.14923/transinfj.2023pdp0017

ISSN: 18810225; 18804535

本文言語コード: ja

データソース種別

JaLC

抄録ライセンスフラグ: 使用不可

言語横断検索・リランキングに基づく目的言語翻訳メモリ利用型NMT

書誌事項

抄録

収録刊行物

キーワード

詳細情報詳細情報について

書き出し

問題の指摘

言語横断検索・リランキングに基づく目的言語翻訳メモリ利用型NMT

書誌事項

抄録

収録刊行物

キーワード

詳細情報 詳細情報について

書き出し

問題の指摘

参加プロジェクトリスト

詳細情報詳細情報について