文内コンテキストを利用した分割統治ニューラル機械翻訳

  • 石川 隆太
    奈良先端科学技術大学院大学 現所属:株式会社リクルート
  • 加納 保昌
    奈良先端科学技術大学院大学 現所属:株式会社Tleez
  • 須藤 克仁
    奈良先端科学技術大学院大学 奈良女子大学
  • 中村 哲
    奈良先端科学技術大学院大学 香港中文大学(深圳)

書誌事項

タイトル別名
  • Divide-and-Conquer Neural Machine Translation Using Intra-Sentence Context

この論文をさがす

説明

<p> ニューラル機械翻訳 (NMT) は柔軟な訳語選択と流暢な訳出により品質の高い翻訳が得られることが多いが,長い入力文に対しては翻訳の品質が低下することがある.この課題に対し,長文を短いセグメントに分割して翻訳し,並べ替えて繋げる分割統治的手法が提案されているものの,NMT での性能向上は限定的であった.そこで本研究では,文内コンテキストを利用することで長文の翻訳を改善する新しい分割統治的 NMT の手法を提案する.提案手法では,(1) 構文解析によって同定された節を結ぶ等位接続詞の前後で分割し,(2) 分割された各節を,その文内コンテキストを利用できるように調整された節単位翻訳用モデルを用いて翻訳し,(3) 翻訳された節を別の sequence-to-sequence モデルを使用して結合し,文全体の翻訳結果を得る.事前訓練された多言語BARTモデルを使用しASPECを対象にした英日翻訳の実験において,特に 41 単語以上の長い入力文に対して,提案手法によりベースラインの多言語 BART による NMT を上回る翻訳精度が得られた.</p>

収録刊行物

  • 自然言語処理

    自然言語処理 32 (1), 114-133, 2025

    一般社団法人 言語処理学会

参考文献 (12)*注記

もっと見る

詳細情報 詳細情報について

問題の指摘

ページトップへ