書誌事項
- タイトル別名
-
- Monolingual Phrase Alignment Based on Word Embedding
抄録
<p> 本研究では,単語分散表現に基づく単一言語内フレーズアラインメント手法を提案する.単一言語内フレーズアラインメントは,同一言語の文対に含まれる言い換えフレーズを対応付けるタスクである.既存手法は大規模な辞書や高品質な構文解析器を使用しており,依存する言語資源の観点から英語以外の言語への拡張が難しい.提案手法は学習済みの単語分散表現のみを用いるため,多くの言語において大規模に利用可能な単言語のコーパスのみに依存する.提案手法では,はじめに単語分散表現に基づいて単語アラインメントを獲得し,次に対訳フレーズアラインメントのヒューリスティクスを用いてフレーズアラインメントの候補を得る.最後に,単語分散表現から構成したフレーズ表現を用いて計算したアラインメントスコアに基づいて,適切なフレーズ対の組み合わせをラティス構造を用いて探索する.英語での評価実験により,既存のフレーズアラインメント手法を上回るF値を達成し,性能の改善を確認した.また,日本語のデータセットを構築して行った分析では,英語以外の言語へ容易に適用できることを確認した.</p>
収録刊行物
-
- 自然言語処理
-
自然言語処理 28 (2), 508-531, 2021
一般社団法人 言語処理学会
- Tweet
キーワード
詳細情報 詳細情報について
-
- CRID
- 1390569845479543680
-
- NII論文ID
- 130008052584
-
- ISSN
- 21858314
- 13407619
-
- 本文言語コード
- ja
-
- データソース種別
-
- JaLC
- Crossref
- CiNii Articles
-
- 抄録ライセンスフラグ
- 使用不可