JParaBank:機械翻訳に基づく大規模な日本語言い換え文対の収集
書誌事項
- タイトル別名
-
- JParaBank: A Large-Scale Sentence Pairs of Japanese Paraphrase via Machine Translation
説明
<p>本研究では、言い換え生成器を訓練するための大規模な日本語の言い換え文対JParaBankを構築し、公開する。大規模な言い換え文対であるParaBankは、英語や中国語において構築され、言い換えによるデータ拡張を通じて様々な自然言語処理タスクの性能改善に貢献している。我々は他言語における先行研究と同様に、大規模な対訳コーパスに対して逆翻訳を適用することで言い換えを生成し、言い換え文対を収集した。日本語言語理解ベンチマークJGLUEにおける評価実験の結果、JParaBankに基づく言い換えによるデータ拡張の有効性を確認した。</p>
収録刊行物
-
- 人工知能学会全国大会論文集
-
人工知能学会全国大会論文集 JSAI2023 (0), 4Xin113-4Xin113, 2023
一般社団法人 人工知能学会
- Tweet
詳細情報 詳細情報について
-
- CRID
- 1390015333244858880
-
- ISSN
- 27587347
-
- 本文言語コード
- ja
-
- データソース種別
-
- JaLC
-
- 抄録ライセンスフラグ
- 使用不可