Dec, 2023

稳健建筑控制的主动强化学习

TL;DR在建筑控制领域,本研究提出了一种新颖的 UED 算法 ActivePLR,通过使用具有不确定性感知的神经网络结构,在 RL 代理的能力极限处生成新的训练环境,并能够优先考虑在基准环境中的性能,表明 ActivePLR 能够在最小化能源消耗的同时最大化居住者舒适度方面优于最先进的 UED 算法。