単語分散表現に基づく単一言語内フレーズアラインメント

書誌事項

タイトル別名
  • Monolingual Phrase Alignment Based on Word Embedding

抄録

<p> 本研究では,単語分散表現に基づく単一言語内フレーズアラインメント手法を提案する.単一言語内フレーズアラインメントは,同一言語の文対に含まれる言い換えフレーズを対応付けるタスクである.既存手法は大規模な辞書や高品質な構文解析器を使用しており,依存する言語資源の観点から英語以外の言語への拡張が難しい.提案手法は学習済みの単語分散表現のみを用いるため,多くの言語において大規模に利用可能な単言語のコーパスのみに依存する.提案手法では,はじめに単語分散表現に基づいて単語アラインメントを獲得し,次に対訳フレーズアラインメントのヒューリスティクスを用いてフレーズアラインメントの候補を得る.最後に,単語分散表現から構成したフレーズ表現を用いて計算したアラインメントスコアに基づいて,適切なフレーズ対の組み合わせをラティス構造を用いて探索する.英語での評価実験により,既存のフレーズアラインメント手法を上回るF値を達成し,性能の改善を確認した.また,日本語のデータセットを構築して行った分析では,英語以外の言語へ容易に適用できることを確認した.</p>

収録刊行物

  • 自然言語処理

    自然言語処理 28 (2), 508-531, 2021

    一般社団法人 言語処理学会

参考文献 (20)*注記

もっと見る

詳細情報 詳細情報について

問題の指摘

ページトップへ