通过强化学习对流行病控制政策的建模与优化

Jan, 2024

通过强化学习对流行病控制政策的建模与优化

Modeling and Optimization of Epidemiological Control Policies Through Reinforcement Learning

Ishir Rao

TL;DR通过使用多目标强化学习和流行病学模型，研究提供了一种优化决策的方法来同时减少经济影响和感染率的多种大流行病场景。

Abstract

pandemics involve the high transmission of a disease that impacts global and local health and economic patterns. The impact of a pandemic can be minimized by enforcing certain restrictions on a community. However

pandemics restrictions epidemiological models multi-objective reinforcement learning seird model

发现论文，激发创造

COVID-19 缓解政策优化的强化学习

本研究使用强化学习和基于代理的模拟器，探讨如何优化减轻 COVID-19 冲击的策略，以最小化其对经济的影响，同时避免超过医院的收治能力。该研究结果验证了其用于仿真传染病传播的精细程度以及强化学习方法在实际中的表现。

Oct, 2020

SIR-RL：新兴市场和发展中经济体流行病爆发的优化政策控制强化学习

本研究介绍了一种创新和伦理的策略来在传染病爆发期间平衡公共卫生和经济稳定，通过引入一种新型强化学习框架，该框架利用 SIR 模型，整合了封锁措施（通过严格指数）和疫苗接种策略来模拟疾病动态。

Apr, 2024

深度强化学习用于大规模疫情控制

本文使用深度强化学习方法，针对流感大流行背景下预防策略自动学习的挑战性进程，建立新的流行病学元群体模型，利用极近政策优化算法学习单一区域的预防策略，并在 11 个区域的联合控制 policy 中考虑区域间的协作，从而有效应对具有大状态空间的复杂流行病学模型。

Mar, 2020

利用强化学习探究多目标 COVID-19 缓解政策的帕累托前沿

本研究使用深度多目标强化学习方法，以 Pareto Conditioned Networks (PCN) 算法为基础，尝试学习并平衡 COVID-19 流行病的多种防控策略，涉及病例、医院感染率、社会负担等多个指标，为疫情决策提供了重要洞见。

Apr, 2022

使用深度确定性策略梯度的大规模基于代理的流行病学模型的流行病控制

本研究基于深度确定性策略梯度（DDPG）框架，使用大规模（100,000 个个体）的流行病学代理模拟，进行多目标优化，确定了最佳的封锁和疫苗接种策略，以在经济活动的基础模拟中实现最优经济和平衡健康目标。

Apr, 2023

基于数据驱动的 COVID-19 退出策略仿真与优化

在这篇文章中，我们提出了一种基于深度学习估计疫情参数的流行病学参数预测工具包，结合遗传算法组件搜索决策制定者设定的约束和目标的最优权衡 / 政策来预测病例和死亡，并且实验结果表明我们的方法比 75% 的传统基于规则的流行病学模型预测出错率更低，在学习转移和未见过的国家测试的情况下实现了 95% 的 R2 得分。

Jun, 2020

应对流行期间教育场所的安全占用策略的强化学习

采用强化学习方法的 SafeCampus 工具在教育机构中模拟疫情扩散和探索强化学习算法，平衡最小化感染与最大化线下交流的策略。

Dec, 2023

基于时变 SIRD、粒子群优化和深度学习的流行病建模

我们开发了一种涵盖流行病建模、粒子群优化和深度学习的混合模型，用于处理非平稳模式和流行病的多个波动，并在全部三个数据集上超越了现有方法。

Jan, 2024

强化疫情控制：拯救生命和经济

本研究将 Origin-Designation 数据应用于控制区域流动性，以解决疫情控制和经济发展的两难问题，并设计了一种名为 DURLECA 的算法来搜索最佳的流动性控制策略，通过使用 Flow-GNN 模型来评估病毒传播风险，通过 DURLECA 模型，成功将城市中的感染率降低至极低，同时保持了 76% 的城市流动性。

Aug, 2020

流行病政策制定的可解释人工智能

本文利用混合强化学习和进化计算的方法，基于现有的模拟器生成可解释的政策，以在减少 COVID-19 传播的同时最小化经济损失，与先前的研究和政府政策相比，得出了具有更好性能的简化的政策。

Apr, 2022