勝率に基づく評価関数の評価と最適化

Bibliographic Information

Other Title
  • ショウリツ ニ モトズク ヒョウカ カンスウ ノ ヒョウカ ト サイテキカ
  • Evaluation and Adjustment of Evaluation Functions Based on Relation between Static Values and Win Ratios
  • 評価関数

Search this article

Abstract

勝率と評価値の関係に基づいた問題点の発見手法を提案し,その有効性を示す.強いプログラムの作成には良い評価関数が不可欠だが,既存の評価関数の問題点の発見や評価値の適切な調整には,対戦などの試行錯誤が必要であり困難であった.本研究ではまず,問題点の発見手法として,評価関数が与える評価値に対する勝率に着目しそのグラフを描くことを提案し,評価関数に欠陥が存在する場合には複数の線として明確に図示されることを示す.さらに,欠陥を解決した評価関数では評価値に対する勝率のグラフが条件によらず一本化されるため,グラフにより評価関数の改善を確認できることを示す.実際に将棋,チェス,オセロについて評価関数の欠陥を図示ができることを示し,将棋においてはその改善がグラフで確認できることを示す.さらに自己対戦から実力が改善されていることを確認した.

Strong game programs need accurate evaluation functions that predict win ratio for a given state. However, it is not easy to construct such functions. We propose to plot evaluation values and win ratio for some sets of states, with an existing evaluation function. If multiple curves appear, it shows that the evaluation function does not work well for states in a certain condition. Improvement is accomplished if new evaluation curves fit into one curve. We applied this method to Shogi, Chess, and Othello, and showed that by plotting values and win ratios we can visualize the faults of evaluation functions. And our experiments with Shogi showed that we can confirm improvement of evaluation function by plotting values and win ratios. Moreover, significant improvement on strength is confirmed by self-plays.

Journal

Citations (2)*help

See more

References(13)*help

See more

Related Projects

See more

Details 詳細情報について

Report a problem

Back to top