非定常N本腕バンディット問題に対する人間の認知バイアスの適用

  • 大用 庫智
    東京電機大学大学院 理工学研究科 情報学専攻
  • 甲野 佑
    東京電機大学大学院 理工学研究科 情報学専攻
  • 高橋 達二
    東京電機大学 理工学部 情報システムデザイン学系

書誌事項

タイトル別名
  • ヒテイジョウ N ホンワン バンディット モンダイ ニ タイスル ニンゲン ノ ニンチ バイアス ノ テキヨウ

この論文をさがす

抄録

<p>強化学習や経済学、統計学などで基本的な問題として研究されているn本腕バンディット問題で、人間の認知バイアスを実装した価値関数(篠原のLSモデル)を用いると、相対的な評価をもたらすヒューリスティクスとして非常に良く働くが、その一般的な適用法はまだ与えられていない。そこで本発表では、LSを分析し一般化することで、3つ以上の選択肢や非定常な確率分布への対応を可能とし、より現実的な問題群へと応用する。</p>

収録刊行物

詳細情報 詳細情報について

問題の指摘

ページトップへ