Apr, 2022

利用强化学习探究多目标 COVID-19 缓解政策的帕累托前沿

TL;DR本研究使用深度多目标强化学习方法,以 Pareto Conditioned Networks (PCN) 算法为基础,尝试学习并平衡 COVID-19 流行病的多种防控策略,涉及病例、医院感染率、社会负担等多个指标,为疫情决策提供了重要洞见。