Mar, 2024

基于帕累托最优的短期与长期治疗效果估计和策略学习

TL;DR该论文研究了 Pareto 最优估计和政策学习方法,用于识别最有效的治疗方法,通过权衡短期和长期效果最大化总奖励,解决多目标优化和冲突问题。