使用多步深度强化学习的血糖控制的改进策略
本研究使用自编码器和强化学习方法,通过学习数据驱动的策略,确定重症感染病人的个性化最佳血糖控制方法,建立血糖水平与预计90天死亡率的关系,从而减少患者的预测死亡率。
Dec, 2017
本研究使用深度强化学习技术,比较了不同的控制算法。模拟糖尿病患者的数据分析表明,该技术可大幅降低糖尿病患者在控制血糖水平方面面临的风险,而无需专业知识的参与。
Sep, 2020
本文评估了离线强化学习方法,用于开发临床有效的药量策略,通过对UVA/Padova血糖动力学模拟器内的九个虚拟患者的血糖控制进行了研究,发现离线强化学习可以显著提高健康血糖范围内的时间,而不增加低血糖事件。
Apr, 2022
本文提出了一种HyCPAP的混合控制策略,将MPC和集成DRL策略相结合,利用两种策略的优势并补偿各自的限制,并进一步将元学习技术纳入HyCPAP中,以实现对T1DM患者的快速个性化适应。结果表明,我们的方法在闭环葡萄糖管理方面表现优越。
Jul, 2023
该论文提出了一种新颖的多智能体强化学习方法,用于个体化的1型糖尿病(T1D)血糖控制。此方法利用一个闭环系统,包括血糖代谢模型和充当基础-推进剂建议者的多智能体软演员-评论家强化学习模型。性能评估在三种情景下进行,将强化学习代理与传统治疗进行比较。评估指标包括血糖水平(最低、最高和平均值)、在不同血糖范围内的时间,以及平均每天推进剂和基础胰岛素剂量。结果表明,基于强化学习的基础-推进剂显著改善了血糖控制,减少了血糖波动性,并增加了在目标范围内(70-180 mg/dL)的时间。低血糖事件得到有效预防,严重高血糖事件减少。与传统治疗相比,强化学习方法还导致平均每天基础胰岛素剂量的显著降低。这些发现突出了多智能体强化学习方法在实现更好的血糖控制和减轻T1D个体严重高血糖风险方面的有效性。
Jul, 2023
通过强化学习方法,利用基于定性餐食策略的推荐机制,针对Ⅰ型糖尿病患者在餐食时间内计算最佳胰岛素剂量的难题,本研究证明RL方法可以替代标准的精确胰岛素计算方法,在减少血糖波动、提高血糖稳定和生活质量方面表现出色。
Sep, 2023
通过使用自我关注编码器网络的强化学习代理,本研究展示了如何有效地模拟和改善人们在计算进餐后胰岛素剂量方面的直觉过程,以实现更简化治疗的潜力,并为T1D患者提供改善生活质量和糖尿病结果的希望。
Jun, 2024