May, 2024

使用联邦学习训练自主 HVAC 系统

TL;DR本文通过聚合在不同气候区域的多个数据中心上训练的本地策略来学习一个全局的强化学习控制器,以最大程度地减少能源消耗并同时最大化热舒适度,实验证明这种联邦策略相比于单独训练的策略具有更快的学习速度和更强的泛化能力。