深度强化学习用于大规模疫情控制

Mar, 2020

深度强化学习用于大规模疫情控制

Deep reinforcement learning for large-scale epidemic control

Pieter Libin, Arno Moonens, Timothy Verstraeten, Fabian Perez-Sanjines, Niel Hens...

TL;DR本文使用深度强化学习方法，针对流感大流行背景下预防策略自动学习的挑战性进程，建立新的流行病学元群体模型，利用极近政策优化算法学习单一区域的预防策略，并在 11 个区域的联合控制 policy 中考虑区域间的协作，从而有效应对具有大状态空间的复杂流行病学模型。

Abstract

epidemics of infectious diseases are an important threat to public health and global economies. Yet, the development of prevention strategies

epidemics infectious diseases prevention strategies reinforcement learning pandemic influenza

发现论文，激发创造

通过强化学习对流行病控制政策的建模与优化

通过使用多目标强化学习和流行病学模型，研究提供了一种优化决策的方法来同时减少经济影响和感染率的多种大流行病场景。

Jan, 2024

COVID-19 缓解政策优化的强化学习

本研究使用强化学习和基于代理的模拟器，探讨如何优化减轻 COVID-19 冲击的策略，以最小化其对经济的影响，同时避免超过医院的收治能力。该研究结果验证了其用于仿真传染病传播的精细程度以及强化学习方法在实际中的表现。

Oct, 2020

利用强化学习探究多目标 COVID-19 缓解政策的帕累托前沿

本研究使用深度多目标强化学习方法，以 Pareto Conditioned Networks (PCN) 算法为基础，尝试学习并平衡 COVID-19 流行病的多种防控策略，涉及病例、医院感染率、社会负担等多个指标，为疫情决策提供了重要洞见。

Apr, 2022

使用深度确定性策略梯度的大规模基于代理的流行病学模型的流行病控制

本研究基于深度确定性策略梯度（DDPG）框架，使用大规模（100,000 个个体）的流行病学代理模拟，进行多目标优化，确定了最佳的封锁和疫苗接种策略，以在经济活动的基础模拟中实现最优经济和平衡健康目标。

Apr, 2023

SIR-RL：新兴市场和发展中经济体流行病爆发的优化政策控制强化学习

本研究介绍了一种创新和伦理的策略来在传染病爆发期间平衡公共卫生和经济稳定，通过引入一种新型强化学习框架，该框架利用 SIR 模型，整合了封锁措施（通过严格指数）和疫苗接种策略来模拟疾病动态。

Apr, 2024

基于联邦强化学习的疫情决策系统

疫情决策的强化联邦学习模型可以帮助政府综合考虑公共安全与经济发展，实现健康安全与经济发展之间的平衡，同时保护数据隐私。

Nov, 2023

应对流行期间教育场所的安全占用策略的强化学习

采用强化学习方法的 SafeCampus 工具在教育机构中模拟疫情扩散和探索强化学习算法，平衡最小化感染与最大化线下交流的策略。

Dec, 2023

深度强化学习与协作图神经网络在疫苗优先级排序中的应用

本文探讨了在供应有限的情况下通过疫苗优先策略来减轻疫情总负担的方法，利用 Trans-vaccine-SEIR 模型模拟疾病演化过程，结合图神经网络和深度强化学习找到最优疫苗分配策略，实验发现相较于基线策略，该框架可将感染和死亡降低 7%-10%，且能针对具有多样性的微观级疾病演化系统寻找最优解。研究结果对于疫苗供应有限和物流效率低下的区域提供了有价值的见解。

May, 2023

流行病政策制定的可解释人工智能

本文利用混合强化学习和进化计算的方法，基于现有的模拟器生成可解释的政策，以在减少 COVID-19 传播的同时最小化经济损失，与先前的研究和政府政策相比，得出了具有更好性能的简化的政策。

Apr, 2022

学习行动：算法和模型在疫情应对中的新型整合

该研究提出了一个框架，可以通过机器学习算法从流行病学模型中学习，为流行病规划提供帮助，并通过 Apache-2.0 授权发布该工作，以提高基于证据的决策制定的能力。

Oct, 2022