利用强化学习探究多目标 COVID-19 缓解政策的帕累托前沿

Apr, 2022

利用强化学习探究多目标 COVID-19 缓解政策的帕累托前沿

Exploring the Pareto front of multi-objective COVID-19 mitigation policies using reinforcement learning

Mathieu Reymond, Conor F. Hayes, Lander Willem, Roxana Rădulescu, Steven Abrams...

TL;DR本研究使用深度多目标强化学习方法，以 Pareto Conditioned Networks (PCN) 算法为基础，尝试学习并平衡 COVID-19 流行病的多种防控策略，涉及病例、医院感染率、社会负担等多个指标，为疫情决策提供了重要洞见。

Abstract

Infectious disease outbreaks can have a disruptive impact on public health and societal processes. As decision making in the context of epidemic mitigation is hard, reinforcement learning provides a methodology to automatically learn prevention strategies in combination with complex ep

reinforcement learning epidemic mitigation multi-objective approach covid-19 complex epidemiological models

发现论文，激发创造

COVID-19 缓解政策优化的强化学习

本研究使用强化学习和基于代理的模拟器，探讨如何优化减轻 COVID-19 冲击的策略，以最小化其对经济的影响，同时避免超过医院的收治能力。该研究结果验证了其用于仿真传染病传播的精细程度以及强化学习方法在实际中的表现。

Oct, 2020

通过强化学习对流行病控制政策的建模与优化

通过使用多目标强化学习和流行病学模型，研究提供了一种优化决策的方法来同时减少经济影响和感染率的多种大流行病场景。

Jan, 2024

深度强化学习用于大规模疫情控制

本文使用深度强化学习方法，针对流感大流行背景下预防策略自动学习的挑战性进程，建立新的流行病学元群体模型，利用极近政策优化算法学习单一区域的预防策略，并在 11 个区域的联合控制 policy 中考虑区域间的协作，从而有效应对具有大状态空间的复杂流行病学模型。

Mar, 2020

SIR-RL：新兴市场和发展中经济体流行病爆发的优化政策控制强化学习

本研究介绍了一种创新和伦理的策略来在传染病爆发期间平衡公共卫生和经济稳定，通过引入一种新型强化学习框架，该框架利用 SIR 模型，整合了封锁措施（通过严格指数）和疫苗接种策略来模拟疾病动态。

Apr, 2024

基于联邦强化学习的疫情决策系统

疫情决策的强化联邦学习模型可以帮助政府综合考虑公共安全与经济发展，实现健康安全与经济发展之间的平衡，同时保护数据隐私。

Nov, 2023

流行病政策制定的可解释人工智能

本文利用混合强化学习和进化计算的方法，基于现有的模拟器生成可解释的政策，以在减少 COVID-19 传播的同时最小化经济损失，与先前的研究和政府政策相比，得出了具有更好性能的简化的政策。

Apr, 2022

使用深度确定性策略梯度的大规模基于代理的流行病学模型的流行病控制

本研究基于深度确定性策略梯度（DDPG）框架，使用大规模（100,000 个个体）的流行病学代理模拟，进行多目标优化，确定了最佳的封锁和疫苗接种策略，以在经济活动的基础模拟中实现最优经济和平衡健康目标。

Apr, 2023

深度强化学习与协作图神经网络在疫苗优先级排序中的应用

本文探讨了在供应有限的情况下通过疫苗优先策略来减轻疫情总负担的方法，利用 Trans-vaccine-SEIR 模型模拟疾病演化过程，结合图神经网络和深度强化学习找到最优疫苗分配策略，实验发现相较于基线策略，该框架可将感染和死亡降低 7%-10%，且能针对具有多样性的微观级疾病演化系统寻找最优解。研究结果对于疫苗供应有限和物流效率低下的区域提供了有价值的见解。

May, 2023

应对流行期间教育场所的安全占用策略的强化学习

采用强化学习方法的 SafeCampus 工具在教育机构中模拟疫情扩散和探索强化学习算法，平衡最小化感染与最大化线下交流的策略。

Dec, 2023

强化疫情控制：拯救生命和经济

本研究将 Origin-Designation 数据应用于控制区域流动性，以解决疫情控制和经济发展的两难问题，并设计了一种名为 DURLECA 的算法来搜索最佳的流动性控制策略，通过使用 Flow-GNN 模型来评估病毒传播风险，通过 DURLECA 模型，成功将城市中的感染率降低至极低，同时保持了 76% 的城市流动性。

Aug, 2020