強化学習による土壌熱交換システムの制御手法の提案 (第1報)反事実報酬を組み込んだMulti Discrete Action環境への実装

DOI

抄録

<p>本論文では、複数の外気量を有する土壌熱交換システムの強化学習の第一段階として、Multi Discrete Action環境への強化学習制御の適用性を検討した。Agentが選択した行動と反事実の行動を評価する報酬関数を定義し、学習を行った。学習の結果、外調機の処理熱量の削減とシステム内の結露抑制に関する二種の報酬を同時に増加させる学習が可能であることを確認した。</p>

収録刊行物

詳細情報 詳細情報について

  • CRID
    1390856904109907968
  • DOI
    10.18948/shasetaikai.2021.2.0_137
  • ISSN
    24242179
    18803806
  • 本文言語コード
    ja
  • データソース種別
    • JaLC
  • 抄録ライセンスフラグ
    使用不可

問題の指摘

ページトップへ