离线强化学习用于 1 型糖尿病患者血糖更安全的控制
本研究使用深度强化学习技术,比较了不同的控制算法。模拟糖尿病患者的数据分析表明,该技术可大幅降低糖尿病患者在控制血糖水平方面面临的风险,而无需专业知识的参与。
Sep, 2020
该论文提出了一种新颖的多智能体强化学习方法,用于个体化的 1 型糖尿病 (T1D) 血糖控制。此方法利用一个闭环系统,包括血糖代谢模型和充当基础 - 推进剂建议者的多智能体软演员 - 评论家强化学习模型。性能评估在三种情景下进行,将强化学习代理与传统治疗进行比较。评估指标包括血糖水平 (最低、最高和平均值)、在不同血糖范围内的时间,以及平均每天推进剂和基础胰岛素剂量。结果表明,基于强化学习的基础 - 推进剂显著改善了血糖控制,减少了血糖波动性,并增加了在目标范围内 (70-180 mg/dL) 的时间。低血糖事件得到有效预防,严重高血糖事件减少。与传统治疗相比,强化学习方法还导致平均每天基础胰岛素剂量的显著降低。这些发现突出了多智能体强化学习方法在实现更好的血糖控制和减轻 T1D 个体严重高血糖风险方面的有效性。
Jul, 2023
通过强化学习方法,利用基于定性餐食策略的推荐机制,针对 Ⅰ 型糖尿病患者在餐食时间内计算最佳胰岛素剂量的难题,本研究证明 RL 方法可以替代标准的精确胰岛素计算方法,在减少血糖波动、提高血糖稳定和生活质量方面表现出色。
Sep, 2023
本文提出了一种 HyCPAP 的混合控制策略,将 MPC 和集成 DRL 策略相结合,利用两种策略的优势并补偿各自的限制,并进一步将元学习技术纳入 HyCPAP 中,以实现对 T1DM 患者的快速个性化适应。结果表明,我们的方法在闭环葡萄糖管理方面表现优越。
Jul, 2023
本研究采用离线强化学习算法解决无线电资源管理问题,通过评估使用行为策略收集的异构数据集来提出一种新的离线强化学习解决方案,表明在适当混合数据集的情况下,离线强化学习能够产生接近最优的强化学习策略。
Nov, 2023
本研究使用自编码器和强化学习方法,通过学习数据驱动的策略,确定重症感染病人的个性化最佳血糖控制方法,建立血糖水平与预计 90 天死亡率的关系,从而减少患者的预测死亡率。
Dec, 2017