平易なコーパスを用いないテキスト平易化

書誌事項

タイトル別名
  • Text Simplification without Simplified Corpora
  • ヘイイ ナ コーパス オ モチイナイ テキスト ヘイイカ
公開日
2018-03-15
DOI
  • 10.5715/jnlp.25.223
公開者
一般社団法人 言語処理学会

この論文をさがす

説明

<p>難解なテキストと平易なテキストからなる大規模な単言語パラレルコーパスを用いて,テキスト平易化が活発に研究されている.しかし,英語以外の多くの言語では平易に書かれた大規模なコーパスを利用できないため,テキスト平易化のためのパラレルコーパスを構築するコストが高い.そこで本研究では,テキスト平易化のための大規模な疑似パラレルコーパスを自動構築する教師なし手法を提案する.我々の提案するフレームワークでは,リーダビリティ推定と文アライメントを組み合わせることによって,生コーパスのみからテキスト平易化のための単言語パラレルコーパスを自動構築する.統計的機械翻訳を用いた実験の結果,生コーパスのみを用いて学習した我々のテキスト平易化モデルは,平易に書かれた大規模なコーパスを用いて学習した従来のテキスト平易化モデルと同等の性能で平易な同義文を生成できた.</p>

収録刊行物

  • 自然言語処理

    自然言語処理 25 (2), 223-249, 2018-03-15

    一般社団法人 言語処理学会

参考文献 (23)*注記

もっと見る

詳細情報 詳細情報について

問題の指摘

ページトップへ