Nov, 2023

评估美国终结HIV流行计划的多智能体强化学习框架

TL;DR通过多代理强化学习模型,本研究在考虑州际流行病学的相互作用的环境下,提出了用于特定司法管辖区决策分析的模型,并通过对加利福尼亚州和佛罗里达州司法管辖区的实验分析发现,MARL的最优决策与单代理强化学习生成的决策显著不同,突显了司法管辖区变异和相互作用的影响。本研究通过对HIV的全面建模和状态空间、运动空间以及奖励函数的构建,展示了MARL在指导公共卫生政策方面的优势和适用性,并提供了扩展到国家级以指导“结束HIV流行”倡议的框架。