Mar, 2020

深度强化学习用于大规模疫情控制

TL;DR本文使用深度强化学习方法,针对流感大流行背景下预防策略自动学习的挑战性进程,建立新的流行病学元群体模型,利用极近政策优化算法学习单一区域的预防策略,并在 11 个区域的联合控制 policy 中考虑区域间的协作,从而有效应对具有大状态空间的复杂流行病学模型。