強化学習による土壌熱交換システムの制御手法の提案　（第１報）反事実報酬を組み込んだMulti Discrete Action環境への実装

塘田 研仁, 香山 拓生, 白石 靖幸

doi:10.18948/shasetaikai.2021.2.0_137

強化学習による土壌熱交換システムの制御手法の提案　（第１報）反事実報酬を組み込んだMulti Discrete Action環境への実装

DOI

塘田研仁

北九州市立大学
香山拓生

北九州市立大学
白石靖幸

北九州市立大学

抄録

<p>本論文では、複数の外気量を有する土壌熱交換システムの強化学習の第一段階として、Multi Discrete Action環境への強化学習制御の適用性を検討した｡Agentが選択した行動と反事実の行動を評価する報酬関数を定義し､学習を行った｡学習の結果、外調機の処理熱量の削減とシステム内の結露抑制に関する二種の報酬を同時に増加させる学習が可能であることを確認した｡</p>

収録刊行物

空気調和・衛生工学会大会　学術講演論文集

空気調和・衛生工学会大会　学術講演論文集 2021.2 (0), 137-140, 2021

公益社団法人空気調和・衛生工学会

キーワード

詳細情報詳細情報について

CRID

1390856904109907968
DOI

10.18948/shasetaikai.2021.2.0_137
ISSN

24242179

18803806
本文言語コード

ja
データソース種別
- JaLC
抄録ライセンスフラグ
使用不可

書き出し

問題の指摘

ページトップへ

強化学習による土壌熱交換システムの制御手法の提案 （第１報）反事実報酬を組み込んだMulti Discrete Action環境への実装

抄録

収録刊行物

キーワード

詳細情報 詳細情報について

書き出し

問題の指摘

参加プロジェクトリスト

強化学習による土壌熱交換システムの制御手法の提案　（第１報）反事実報酬を組み込んだMulti Discrete Action環境への実装

詳細情報詳細情報について