強化学習による土壌熱交換システムの制御手法の提案 (第1報)反事実報酬を組み込んだMulti Discrete Action環境への実装
抄録
<p>本論文では、複数の外気量を有する土壌熱交換システムの強化学習の第一段階として、Multi Discrete Action環境への強化学習制御の適用性を検討した。Agentが選択した行動と反事実の行動を評価する報酬関数を定義し、学習を行った。学習の結果、外調機の処理熱量の削減とシステム内の結露抑制に関する二種の報酬を同時に増加させる学習が可能であることを確認した。</p>
収録刊行物
-
- 空気調和・衛生工学会大会 学術講演論文集
-
空気調和・衛生工学会大会 学術講演論文集 2021.2 (0), 137-140, 2021
公益社団法人 空気調和・衛生工学会
- Tweet
詳細情報 詳細情報について
-
- CRID
- 1390856904109907968
-
- ISSN
- 24242179
- 18803806
-
- 本文言語コード
- ja
-
- データソース種別
-
- JaLC
-
- 抄録ライセンスフラグ
- 使用不可