1C1-1 Genetic Network Programming with Actor-Critic

Bibliographic Information

Other Title
  • 1C1-1 Actor-Criticを用いた遺伝的ネットワークプログラミング(1C1 強化学習)

Search this article

Description

「Genetic Network Programming,GNP」と称する新しいグラフ構造の進化論的計算手法が開発されている。GNPはグラフ構造で解を表すため表現能力と性能の点で優れている。さらに,タスク実行後の進化に加えてタスク実行の間学習ができるので,効率的に解を求める強化学習を取りいれたGNP (GNP-RL)も提案されている。この論文では,GNP-RLの新しいタイプであるActor-Critic (GNP-AC)を用いたGNPを提案する。元々,GNP-RLは離散的な変数の学習を行うが,GNP-ACは連続変数の学習を目的としている。今回は提案する方法をKheperaシミュレータのコントローラに適用し,壁伝い問題を使用して評価を行う。

Journal

References(7)*help

See more

Details 詳細情報について

Report a problem

Back to top