ゲーミフィケーションに基づくQAデータセット拡充手法の提案: QA Lab-PoliInfo-4 Answer Verificationタスクに向けて

説明

<p>近年,機械学習ライブラリの充実により,アノテーションデータさえあれば誰でも比較的容易に文書分類などのシステムを実装することが可能となった.一方で,既存のアノテーションデータは数量が限られている.特に,精度改善のためにはシステムが間違いやすい部分に焦点を当てたデータが必要であるが,そのようなデータが十分にあるとは限らない.この問題を解決するために,本稿では,地方議会会議録を用いた質問応答タスクを対象として,ゲーミフィケーション的にアノテーションデータを拡充するGamified Dynamic Adversarial Data Collection (GDADC)を提案する.また,GDADCの実践に向けて,NTCIR-17におけるQA Lab-PoliInfo-4のAnswer Verificationタスクの説明をする.</p>

収録刊行物

詳細情報 詳細情報について

  • CRID
    1390013397232194944
  • DOI
    10.57413/wii.18.0_9
  • ISSN
    27582922
  • 本文言語コード
    ja
  • データソース種別
    • JaLC
  • 抄録ライセンスフラグ
    使用可

問題の指摘

ページトップへ