書誌事項
- タイトル別名
-
- Text Simplification without Simplified Corpora
- ヘイイ ナ コーパス オ モチイナイ テキスト ヘイイカ
- 公開日
- 2018-03-15
- DOI
-
- 10.5715/jnlp.25.223
- 公開者
- 一般社団法人 言語処理学会
この論文をさがす
説明
<p>難解なテキストと平易なテキストからなる大規模な単言語パラレルコーパスを用いて,テキスト平易化が活発に研究されている.しかし,英語以外の多くの言語では平易に書かれた大規模なコーパスを利用できないため,テキスト平易化のためのパラレルコーパスを構築するコストが高い.そこで本研究では,テキスト平易化のための大規模な疑似パラレルコーパスを自動構築する教師なし手法を提案する.我々の提案するフレームワークでは,リーダビリティ推定と文アライメントを組み合わせることによって,生コーパスのみからテキスト平易化のための単言語パラレルコーパスを自動構築する.統計的機械翻訳を用いた実験の結果,生コーパスのみを用いて学習した我々のテキスト平易化モデルは,平易に書かれた大規模なコーパスを用いて学習した従来のテキスト平易化モデルと同等の性能で平易な同義文を生成できた.</p>
収録刊行物
-
- 自然言語処理
-
自然言語処理 25 (2), 223-249, 2018-03-15
一般社団法人 言語処理学会
- Tweet
キーワード
詳細情報 詳細情報について
-
- CRID
- 1390845712968302592
-
- NII論文ID
- 130007397051
-
- NII書誌ID
- AN10472659
-
- ISSN
- 21858314
- 13407619
-
- NDL書誌ID
- 028919009
-
- 本文言語コード
- ja
-
- データソース種別
-
- JaLC
- NDLサーチ
- Crossref
- CiNii Articles
- OpenAIRE
-
- 抄録ライセンスフラグ
- 使用不可
