入れ子型並列交渉問題のためのDeep Deterministic Policy Gradient

荒川, 亮太, 藤田, 桂英

抄録

自動交渉の分野では，強化学習を利用して交渉戦略を獲得する研究が進められている．このような研究では，主に1対1の交渉を扱っている．自動交渉をサプライチェーンマネジメントに応用する場合，供給側と需要側の2方向に対して同時に交渉する入れ子型並列交渉を行う必要がある．このような交渉問題では，2方向の交渉を同時に考慮しながら行動選択を行う必要がある．本研究では，入れ子型並列交渉を適切に行う戦略をDeep Deterministic Policy Gradientによって獲得する．並列に行われる交渉の学習器の一部を共有することにより，効果的に学習可能なフレームワークを提案する．

収録刊行物

第85回全国大会講演論文集

第85回全国大会講演論文集 2023 (1), 463-464, 2023-02-16

詳細情報詳細情報について

CRID: 1050579753470403456

NII書誌ID: AN00349328

Web Site: http://id.nii.ac.jp/1001/00229916/

本文言語コード: ja

資料種別: conference paper

データソース種別

IRDB

入れ子型並列交渉問題のためのDeep Deterministic Policy Gradient

この論文をさがす

抄録

収録刊行物

キーワード

詳細情報詳細情報について

書き出し

問題の指摘

入れ子型並列交渉問題のためのDeep Deterministic Policy Gradient

この論文をさがす

抄録

収録刊行物

キーワード

詳細情報 詳細情報について

書き出し

問題の指摘

詳細情報詳細情報について