質問-回答ペアを活用する 半教師あり抽出型質問要約モデルとその学習法

  • 石垣 達也
    産業技術総合研究所 人工知能研究センター
  • 町田 和哉
    東京工業大学工学院情報通信系
  • 小林 隼人
    ヤフー株式会社
  • 高村 大也
    産業技術総合研究所 人工知能研究センター 東京工業大学科学技術創成研究院未来産業技術研究所
  • 奥村 学
    東京工業大学科学技術創成研究院未来産業技術研究所

書誌事項

タイトル別名
  • Semi-Supervised Extractive Question Summarizer Using Question-Answer Pairs and its Learning Methods
  • シツモン-カイトウ ペア オ カツヨウ スル ハンキョウシ アリ チュウシュツガタ シツモン ヨウヤク モデル ト ソノ ガクシュウホウ

この論文をさがす

抄録

<p>本稿は質問を対象とした抽出型要約を扱う.ニューラルネットワークによる抽出型要約モデルの学習には,大規模なラベル付きデータが必要となる.ユーザが自由に記述する Yahoo! 知恵袋などのコミュニティ QA (CQA) に投稿される質問に対しては,ラベル付きデータの獲得が難しい.そこで,本研究ではラベル付きデータが不足する問題を軽減するため,小規模な人手ラベル付きデータに加え,CQA から大量に獲得可能な質問-回答ペアを活用する,半教師あり要約モデルを提案する.また,提案モデルの学習法として,質問-回答ペアを活用した事前学習,同時学習,Distant Supervision による疑似ラベルの活用,サンプリング手法などを提案する.従来の半教師あり学習の枠組みでは考慮されてこなかった,質問-回答といったペア構造から,効率的に要約モデルを学習する手法を考察する.実験より,適切なサンプリング法や疑似ラベルを用いた同時学習手法により,特にラベル付きデータが小規模な場合に良い性能を示したことを報告する.</p>

収録刊行物

  • 自然言語処理

    自然言語処理 27 (4), 825-852, 2020-12-15

    一般社団法人 言語処理学会

参考文献 (30)*注記

もっと見る

詳細情報 詳細情報について

問題の指摘

ページトップへ