Jan, 2024

深度强化学习算法在 HVAC 控制中的实验评估

TL;DR本研究基于 Sinergym 框架对多种先进 DRL 算法在 HVAC 控制中进行了关于舒适度和能源消耗方面的可重复评估,结果表明 SAC 和 TD3 等 DRL 算法在复杂场景下具有潜力,并揭示了与泛化和增量学习有关的若干挑战。