入れ子型並列交渉問題のためのDeep Deterministic Policy Gradient
この論文をさがす
抄録
自動交渉の分野では,強化学習を利用して交渉戦略を獲得する研究が進められている.このような研究では,主に1対1の交渉を扱っている.自動交渉をサプライチェーンマネジメントに応用する場合,供給側と需要側の2方向に対して同時に交渉する入れ子型並列交渉を行う必要がある.このような交渉問題では,2方向の交渉を同時に考慮しながら行動選択を行う必要がある.本研究では,入れ子型並列交渉を適切に行う戦略をDeep Deterministic Policy Gradientによって獲得する.並列に行われる交渉の学習器の一部を共有することにより,効果的に学習可能なフレームワークを提案する.
収録刊行物
-
- 第85回全国大会講演論文集
-
第85回全国大会講演論文集 2023 (1), 463-464, 2023-02-16
- Tweet
キーワード
詳細情報 詳細情報について
-
- CRID
- 1050579753470403456
-
- NII書誌ID
- AN00349328
-
- Web Site
- http://id.nii.ac.jp/1001/00229916/
-
- 本文言語コード
- ja
-
- 資料種別
- conference paper
-
- データソース種別
-
- IRDB