Sep, 2024

受限强化学习在安全热泵控制中的应用

TL;DR本研究针对建筑供热系统中提升能效与居民热舒适度之间的优化难题,提出了一种新颖的方法。通过应用I4B仿真器和无模型受限强化学习算法CSAC-LB,显著提升了数据探索、约束满足与性能,展现了在安全控制中的实用潜力。