Apr, 2022
利用强化学习探究多目标 COVID-19 缓解政策的帕累托前沿
Exploring the Pareto front of multi-objective COVID-19 mitigation policies using reinforcement learning
Mathieu Reymond, Conor F. Hayes, Lander Willem, Roxana Rădulescu, Steven Abrams...
TL;DR本研究使用深度多目标强化学习方法,以 Pareto Conditioned Networks (PCN) 算法为基础,尝试学习并平衡 COVID-19 流行病的多种防控策略,涉及病例、医院感染率、社会负担等多个指标,为疫情决策提供了重要洞见。