入れ子型並列交渉問題のためのDeep Deterministic Policy Gradient

この論文をさがす

抄録

自動交渉の分野では,強化学習を利用して交渉戦略を獲得する研究が進められている.このような研究では,主に1対1の交渉を扱っている.自動交渉をサプライチェーンマネジメントに応用する場合,供給側と需要側の2方向に対して同時に交渉する入れ子型並列交渉を行う必要がある.このような交渉問題では,2方向の交渉を同時に考慮しながら行動選択を行う必要がある.本研究では,入れ子型並列交渉を適切に行う戦略をDeep Deterministic Policy Gradientによって獲得する.並列に行われる交渉の学習器の一部を共有することにより,効果的に学習可能なフレームワークを提案する.

収録刊行物

キーワード

詳細情報 詳細情報について

問題の指摘

ページトップへ