専門家が平易化した記事を用いたやさしい日本語パラレルコーパスの試作

書誌事項

タイトル別名
  • Trial of Sentence Alignment on Professionally Simplified Articles for Japanese Text Simplification

説明

<p>テキスト平易化とは、難解な文を意味を保持したまま、より平易な文に変換するタスクのことである。本タスクにおける日本語の既存のパラレルコーパスは、学生やクラウドワーカーが書いた平易な文から構築されており、専門家が書いたパラレルコーパスは存在しない。我々は、専門家が平易化した記事に対して人手でアライメントをとってパラレルコーパスを構築する。本論文では、現在構築中のコーパスの一部について分析を行った結果を報告する。人手評価の結果、我々のコーパスは多様な平易化操作を含み、既存のコーパスよりも平易な文で構成されていることを確認した。</p>

収録刊行物

詳細情報 詳細情報について

  • CRID
    1390859758174807296
  • DOI
    10.11517/pjsai.jsai2023.0_3xin414
  • ISSN
    27587347
  • 本文言語コード
    ja
  • データソース種別
    • JaLC
  • 抄録ライセンスフラグ
    使用不可

問題の指摘

ページトップへ