ランダムな試行の学習によって構成された15パズルの評価関数について

この論文をさがす

抄録

15パズルなどのスライディングパズルの評価関数は,通常そのパズルの構造に基づいて構成される.これに対して本稿で示す15パズルの評価関数は,実際にゴール状態からスタートしてそのパターンを崩していくことで得られるパターン列を利用して構成される.提案手法では,この列を教師データとして学習させたニューラルネットワーク(NN)を構成し,さらに15パズルを崩す過程で頻繁に出現するパターンを見つけ出しそこからランダムに探索することで,よりよい教師データが得た。このような手法によりマンハッタン距離和関数に比べて探索ノード数が4,200倍程度効率的な評価関数が得られた.

収録刊行物

キーワード

詳細情報 詳細情報について

問題の指摘

ページトップへ