分散減少法を用いた麻雀における実力推定

書誌事項

タイトル別名
  • Performance Evaluation in Mahjong using a Variance Reduction Technique

抄録

麻雀において,プレイヤーの実力を表す指標である平均順位を求める際には,複数の試合の結果を平均するモンテカルロ法が用いられる.この手法では結果の分散が大きく,プレイヤーの実力の信頼区間は幅が大きくなる.そのため,麻雀において正確に実力を推定するためには,膨大な試合数をこなすことが必要になってしまう.例えば,天鳳で十段という素晴らしい成績を達成した Suphx は,十段到達までに約 5 ヶ月かけて 5, 760 試合もの試合数をこなしている.そこで本研究では,平均順位に代わって,プレイヤーの実力をよく表す推定値を求めることを目的とする.平均順位の不偏推定量であり,かつ平均順位よりも分散が小さくなる推定値を求めることができれば,同じ幅の信頼区間を求めるために必要な試合数が削減される.同じ不完全情報ゲームであるポーカーでは,対戦データからプレイヤーの実力の推定値を求める研究が行われている.この手法を応用し,深層ニューラルネットワークを導入することと,試合を局単位に分割することによって,ポーカーよりもゲーム木と盤面の情報が大きい麻雀において,推定を行う手法を提案した.そして,インターネット麻雀「天鳳」の牌譜で評価を行ったところ,提案手法を用いて求めた推定値は平均順位と近い期待値をとることが確認できた.しかし,得られた推定値がプレイヤーの平均順位の不偏推定量となっているかについて検定を行ったところ,有意な結果を示すことはできなかった.推定値の分散は平均順位の分散に比べて 14%小さく,プレイヤーの実力を正しく評価するために必要な試合数が 14%減少することが確認された.

In mahjong, the Monte Carlo method, which averages the results of multiple games, is used to find the average rank, a measure of a player’s ability. The variance of mahjong results is large, and the confidence intervals for a player’s ability are wide. Therefore, a large number of games is required to accurately estimate a player’s mahjong ability. For example, Suphx, who achieved an impressive 10-dan in Tenhou, played 5, 760 games over a period of about 5 months before reaching 10-dan. Then, the objective of this study is to find an estimate that better represents the players’ skill than the average rank. If we can obtain an estimate that is an unbiased estimator of the mean rank and has smaller variance than the mean rank, the number of games needed to obtain a confidence interval of the same width can be reduced. Poker, which is also a game of imperfect information, studies have been conducted to obtain estimates of a player’s ability from game data. We proposed a method for estimation in mahjong, where the game tree and information on the board is larger than in poker, by introducing a deep neural network and dividing the game into smaller units. Experiments were conducted on the records on Tenhou, an Internet mahjong game, and it was confirmed that the estimates obtained using the proposed method have an expected value close to the mean rank. However, when we tested whether the obtained estimates were unbiased estimators of the mean rank of the players, the results were not significant. The variance of the estimate is 14% smaller than the variance of the mean rank, confirming that the number of games required to draw the same statistical conclusion is reduced by 14%.

収録刊行物

キーワード

詳細情報 詳細情報について

問題の指摘

ページトップへ