著者名,論文名,雑誌名,ISSN,出版者名,出版日付,巻,号,ページ,URL,URL(DOI) Harukazu Igarashi and Seiji Ishihara,Hierarchical Policy Gradient Reinforcement Learning : Two-layer Model,芝浦工業大学研究報告 The research reports of Shibaura Institute of Technology,,東京 : 芝浦工業大学,2016,,,21-28,https://cir.nii.ac.jp/crid/1520290884146587264,