要約データの適切性定量化を利用したカリキュラムラーニング

DOI Web Site 参考文献18件 オープンアクセス
  • 狩野 竜示
    富士フイルムビジネスイノベーション株式会社 東京工業大学工学院
  • 谷口 友紀
    富士フイルムビジネスイノベーション株式会社
  • 大熊 智子
    富士フイルムビジネスイノベーション株式会社

書誌事項

タイトル別名
  • Quantifying Appropriateness of Summarization Data for Curriculum Learning

説明

<p>教師あり要約モデルの研究においては,タイトルを本文の要約とみなし学習データとするのが一般的であるが,これらはノイズ,すなわち不適切な本文-要約ペアを多く含む.本研究では,カリキュラムラーニングを用いてこうしたノイズを含むデータから効率的に要約モデルを学習させる手法を検討する.カリキュラムラーニングは学習データを難易度やノイズの量などを表す指標に従ってソートし,段階的な学習を行うことで性能を向上させる手法であり,ノイズを含むデータの学習にも有効である.本研究の目的の 1 つは,これまで検証されてこなかったカリキュラムラーニングの要約タスクへの有効性を検証することである.翻訳タスクの先行研究では,ノイズの多いコーパスと少ないコーパスから学習されたモデルでノイズ定量化を行ったが,要約分野にそうしたコーパスは存在しない.本研究のもう 1 つの目的は,単一コーパスからノイズを定量化してカリキュラムラーニングに適用する手法を提案することである.提案モデルである Appropriateness Estimator は,本文-要約の正しいペアと,ランダムに組み合わせたペアを分類するタスクによって学習され,本文-要約ペアの適切性を計算する.本研究では3つの要約モデルで実験を行い.カリキュラムラーニング及び提案手法が要約モデルの性能を向上させることを示す.</p>

収録刊行物

  • 自然言語処理

    自然言語処理 29 (1), 144-165, 2022

    一般社団法人 言語処理学会

参考文献 (18)*注記

もっと見る

詳細情報 詳細情報について

問題の指摘

ページトップへ