サプライチェーンにおける自動交渉のためのエンべディングを用いた強化学習フレームワーク

この論文をさがす

抄録

本論文では,サプライチェーンにおける取引に関する自動交渉において,交渉相手の戦略モデルを考慮した交渉戦略を学習するための強化学習フレームワークを提案する.交渉相手の戦略のモデリングは,Generative-Discriminative Representationを目的として交渉データから教師なし学習した表現関数によるエンべディングにより実現する.評価実験により,表現関数が交渉戦略を区別するために有効なエンべディングを行えており,提案した強化学習フレームワークが並列交渉において相手毎に自らの選好を最大にする戦略が学習できることを示す.

収録刊行物

キーワード

詳細情報 詳細情報について

問題の指摘

ページトップへ