该论文使用基于强化学习的决策支持工具,结合历史患者数据,推荐个性化的镇静剂及呼吸支持方案,从而最小化康复病房中机械通气时间、重插管率与生理稳定度等重要指标。
Apr, 2017
在本文中,我们引入了一个学习如何预测检查频率与时间的框架,基于临床决策的复合奖励函数,使用批量脱机强化学习,以优化具有成本和风险之间权衡关系的检查选择和时间。
Aug, 2018
通过深度强化学习策略,将测量成本降至最低,同时最大化预测收益,实现基于病人健康历史动态调整的医学测量任务调度,有效地降低了测量次数并提高了预测准确性。
Jan, 2019
通过离线强化学习中的策略评估,本研究提出了一种模型选择方法,使得在医疗保健中学习到的治疗策略更好地在实际环境中投入使用。在利用离线强化学习学习感染性休克患者的治疗策略的过程中,研究人员比较了不同的离线策略评估方式,并提出了一种简单的两阶段方法以平衡计算效率和排名准确性。
Jul, 2021
本文评估了离线强化学习方法,用于开发临床有效的药量策略,通过对UVA/Padova血糖动力学模拟器内的九个虚拟患者的血糖控制进行了研究,发现离线强化学习可以显著提高健康血糖范围内的时间,而不增加低血糖事件。
Apr, 2022
提出一种基于历史数据的新型医疗决策模型,使用深度强化学习解决了传统去强化学习中与环境交互的问题,能够进行连续状态-行动决策空间中的决策,建议的治疗方案比临床医生建议的更具价值和可靠性,能够提供个性化和可解释的抗感染治疗决策,进而提高患者的护理水平。
Jun, 2022
通过对超过17,000个评估实验的案例研究,我们批判性地检视了当前离线强化学习在动态治疗方案中的应用现状,并提出了评估指标的不一致性、缺乏基线比较、以及现有研究中选择的强化学习表示形式的多样性等关注点。令人惊讶的是,在一些情况下,随机基线方法和奖励设计方法的策略评估手段可以超过离线强化学习算法的性能。这要求我们在未来的动态治疗方案研究中要更加谨慎地进行策略评估和算法开发,并邀请社区进一步讨论。
May, 2024
ICU-Sepsis 是一个用于评估强化学习算法的基准环境,可以模拟ICU中脓毒症患者的个性化护理。它是一个轻量级的表格MDP环境,适用于各种强化学习算法,并且具有挑战性,可用于评估其性能。
Jun, 2024
本研究针对重症监护室内肝素剂量管理的复杂性与患者个体差异性,提出了一种基于强化学习的个性化肝素剂量政策,以确保剂量在治疗范围内的精准性。研究通过离线强化学习及其在临床决策中的应用,验证了该政策的有效性,旨在改善肝素使用实践并推动医学决策支持工具的发展。
Sep, 2024
本研究解决了医疗决策中存在的安全性不足问题,提出了一种新颖的Constraint Transformer(CT)方法,利用因果注意机制和生成世界模型进行约束建模。研究发现,CT能够有效识别不安全状态,并在多个医疗情境中实现更低的死亡率,减少不安全行为的发生概率。
Oct, 2024