本研究使用强化学习和基于代理的模拟器,探讨如何优化减轻 COVID-19 冲击的策略,以最小化其对经济的影响,同时避免超过医院的收治能力。该研究结果验证了其用于仿真传染病传播的精细程度以及强化学习方法在实际中的表现。
Oct, 2020
本研究介绍了一种创新和伦理的策略来在传染病爆发期间平衡公共卫生和经济稳定,通过引入一种新型强化学习框架,该框架利用 SIR 模型,整合了封锁措施(通过严格指数)和疫苗接种策略来模拟疾病动态。
Apr, 2024
本文使用深度强化学习方法,针对流感大流行背景下预防策略自动学习的挑战性进程,建立新的流行病学元群体模型,利用极近政策优化算法学习单一区域的预防策略,并在 11 个区域的联合控制 policy 中考虑区域间的协作,从而有效应对具有大状态空间的复杂流行病学模型。
Mar, 2020
本研究使用深度多目标强化学习方法,以 Pareto Conditioned Networks (PCN) 算法为基础,尝试学习并平衡 COVID-19 流行病的多种防控策略,涉及病例、医院感染率、社会负担等多个指标,为疫情决策提供了重要洞见。
Apr, 2022
本研究基于深度确定性策略梯度(DDPG)框架,使用大规模(100,000 个个体)的流行病学代理模拟,进行多目标优化,确定了最佳的封锁和疫苗接种策略,以在经济活动的基础模拟中实现最优经济和平衡健康目标。
Apr, 2023
在这篇文章中,我们提出了一种基于深度学习估计疫情参数的流行病学参数预测工具包,结合遗传算法组件搜索决策制定者设定的约束和目标的最优权衡 / 政策来预测病例和死亡,并且实验结果表明我们的方法比 75% 的传统基于规则的流行病学模型预测出错率更低,在学习转移和未见过的国家测试的情况下实现了 95% 的 R2 得分。
Jun, 2020
采用强化学习方法的 SafeCampus 工具在教育机构中模拟疫情扩散和探索强化学习算法,平衡最小化感染与最大化线下交流的策略。
Dec, 2023
我们开发了一种涵盖流行病建模、粒子群优化和深度学习的混合模型,用于处理非平稳模式和流行病的多个波动,并在全部三个数据集上超越了现有方法。
Jan, 2024
本研究将 Origin-Designation 数据应用于控制区域流动性,以解决疫情控制和经济发展的两难问题,并设计了一种名为 DURLECA 的算法来搜索最佳的流动性控制策略,通过使用 Flow-GNN 模型来评估病毒传播风险,通过 DURLECA 模型,成功将城市中的感染率降低至极低,同时保持了 76% 的城市流动性。
Aug, 2020
本文利用混合强化学习和进化计算的方法,基于现有的模拟器生成可解释的政策,以在减少 COVID-19 传播的同时最小化经济损失,与先前的研究和政府政策相比,得出了具有更好性能的简化的政策。