勝率に基づく評価関数の評価と最適化

書誌事項

タイトル別名
  • ショウリツ ニ モトズク ヒョウカ カンスウ ノ ヒョウカ ト サイテキカ
  • Evaluation and Adjustment of Evaluation Functions Based on Relation between Static Values and Win Ratios
  • 評価関数

この論文をさがす

抄録

勝率と評価値の関係に基づいた問題点の発見手法を提案し,その有効性を示す.強いプログラムの作成には良い評価関数が不可欠だが,既存の評価関数の問題点の発見や評価値の適切な調整には,対戦などの試行錯誤が必要であり困難であった.本研究ではまず,問題点の発見手法として,評価関数が与える評価値に対する勝率に着目しそのグラフを描くことを提案し,評価関数に欠陥が存在する場合には複数の線として明確に図示されることを示す.さらに,欠陥を解決した評価関数では評価値に対する勝率のグラフが条件によらず一本化されるため,グラフにより評価関数の改善を確認できることを示す.実際に将棋,チェス,オセロについて評価関数の欠陥を図示ができることを示し,将棋においてはその改善がグラフで確認できることを示す.さらに自己対戦から実力が改善されていることを確認した.

Strong game programs need accurate evaluation functions that predict win ratio for a given state. However, it is not easy to construct such functions. We propose to plot evaluation values and win ratio for some sets of states, with an existing evaluation function. If multiple curves appear, it shows that the evaluation function does not work well for states in a certain condition. Improvement is accomplished if new evaluation curves fit into one curve. We applied this method to Shogi, Chess, and Othello, and showed that by plotting values and win ratios we can visualize the faults of evaluation functions. And our experiments with Shogi showed that we can confirm improvement of evaluation function by plotting values and win ratios. Moreover, significant improvement on strength is confirmed by self-plays.

収録刊行物

被引用文献 (2)*注記

もっと見る

参考文献 (13)*注記

もっと見る

関連プロジェクト

もっと見る

詳細情報 詳細情報について

問題の指摘

ページトップへ