Feb, 2023

深度强化学习用于成本效益医学诊断

TL;DR本文介绍了一种利用增强学习和奖励设计方法优化实验测试序列,以最大化 F1 得分和降低成本的动态诊断策略。作者使用基于半模型深度诊断策略优化 (SM-DDPO) 的方法处理多种临床任务的数据,实现了高准确性和高成本效益