畳み込みニューラルネットワークを用いたProfit SharingにおけるExperience Replayの利用

久保田, 英豊, 長名, 優子

【Updated on May 12, 2025】 Integration of CiNii Dissertations and CiNii Books into CiNii Research
Trial version of CiNii Research Knowledge Graph Search feature is available on CiNii Labs
【Updated on June 30, 2025】Suspension and deletion of data provided by Nikkei BP
Regarding the recording of “Research Data” and “Evidence Data”

畳み込みニューラルネットワークを用いたProfit SharingにおけるExperience Replayの利用

IPSJ

Search this article

CiNii Books

Description

本研究では、畳み込みニューラルネットワークを用いたProfit SharingにおけるExperience Replayの利用を提案する。Profit Sharingにおける行動価値を学習する場合には、Deep Q NetworkにおけるExperience Replayをそのまま利用することはできない。Profit Sharingにおける行動価値を学習する際の誤差関数では報酬分配量が教師信号として用いられるため、メモリに観測、行動、報酬分配量の3つを蓄積しておくこととする。こうすることで、メモリに蓄積したデータからランダムにとり出してミニバッチを生成することが可能となり、学習の際に何度もデータを利用することが可能になる。

Journal

第85回全国大会講演論文集

第85回全国大会講演論文集 2023 (1), 855-856, 2023-02-16

情報処理学会

Keywords

人工知能と認知科学

Details 詳細情報について

CRID

1050579753470361344
NII Book ID

AN00349328
Web Site

https://ipsj.ixsq.nii.ac.jp/records/230213
Text Lang

ja
Article Type

conference paper
Data Source
- IRDB

畳み込みニューラルネットワークを用いたProfit SharingにおけるExperience Replayの利用

Search this article

Description

Journal

Keywords

Details 詳細情報について

Export

Report a problem