离线强化学习用于 1 型糖尿病患者血糖更安全的控制

Apr, 2022

离线强化学习用于 1 型糖尿病患者血糖更安全的控制

Offline Reinforcement Learning for Safer Blood Glucose Control in People with Type 1 Diabetes

Harry Emerson, Matt Guy, Ryan McConville

TL;DR本文评估了离线强化学习方法，用于开发临床有效的药量策略，通过对 UVA/Padova 血糖动力学模拟器内的九个虚拟患者的血糖控制进行了研究，发现离线强化学习可以显著提高健康血糖范围内的时间，而不增加低血糖事件。

Abstract

hybrid closed loop systems represent the future of care for people with type 1 diabetes (T1D). These devices usually utilise simple control algorithms to select the optimal insulin dose for maintaining blood glucose levels within a healthy range. →

hybrid closed loop systems online reinforcement learning offline rl blood glucose control dosing policies

发现论文，激发创造

闭环血糖控制的深度强化学习

本研究使用深度强化学习技术，比较了不同的控制算法。模拟糖尿病患者的数据分析表明，该技术可大幅降低糖尿病患者在控制血糖水平方面面临的风险，而无需专业知识的参与。

Sep, 2020

糖血糖控制的端到端离线强化学习

使用离线强化学习代理人和个性化流程提高闭环系统的性能，消除对模拟器的依赖，实现糖尿病的血糖控制。

Oct, 2023

基于多智能体强化学习方法的 1 型糖尿病（T1D）患者基础波鲁斯顾问

该论文提出了一种新颖的多智能体强化学习方法，用于个体化的 1 型糖尿病 (T1D) 血糖控制。此方法利用一个闭环系统，包括血糖代谢模型和充当基础 - 推进剂建议者的多智能体软演员 - 评论家强化学习模型。性能评估在三种情景下进行，将强化学习代理与传统治疗进行比较。评估指标包括血糖水平 (最低、最高和平均值)、在不同血糖范围内的时间，以及平均每天推进剂和基础胰岛素剂量。结果表明，基于强化学习的基础 - 推进剂显著改善了血糖控制，减少了血糖波动性，并增加了在目标范围内 (70-180 mg/dL) 的时间。低血糖事件得到有效预防，严重高血糖事件减少。与传统治疗相比，强化学习方法还导致平均每天基础胰岛素剂量的显著降低。这些发现突出了多智能体强化学习方法在实现更好的血糖控制和减轻 T1D 个体严重高血糖风险方面的有效性。

Jul, 2023

利用强化学习简化 1 型糖尿病患者的餐时胰岛素剂量：仿真实验

通过强化学习方法，利用基于定性餐食策略的推荐机制，针对 Ⅰ 型糖尿病患者在餐食时间内计算最佳胰岛素剂量的难题，本研究证明 RL 方法可以替代标准的精确胰岛素计算方法，在减少血糖波动、提高血糖稳定和生活质量方面表现出色。

Sep, 2023

使用多步深度强化学习的血糖控制的改进策略

通过深度强化学习和多步算法，本研究在血糖控制方面验证了多步强化学习的有效性，可能有助于探索最佳血糖控制措施，提高糖尿病患者的生存率。

Mar, 2024

通过预训练的反事实可逆神经网络实现血糖控制

基于反事实可逆神经网络的内省强化学习在血糖控制中表现出更高的稳定性和安全性。

May, 2024

深度学习在现实世界中的 1 型糖尿病管理中的安全挑战

使用深度学习算法模拟血糖动力学的实际应用和局限性的研究。

Oct, 2023

通过集成深度强化学习的混合控制策略应用于人工胰腺

本文提出了一种 HyCPAP 的混合控制策略，将 MPC 和集成 DRL 策略相结合，利用两种策略的优势并补偿各自的限制，并进一步将元学习技术纳入 HyCPAP 中，以实现对 T1DM 患者的快速个性化适应。结果表明，我们的方法在闭环葡萄糖管理方面表现优越。

Jul, 2023

基于混合数据集的无线网络优化的离线强化学习

本研究采用离线强化学习算法解决无线电资源管理问题，通过评估使用行为策略收集的异构数据集来提出一种新的离线强化学习解决方案，表明在适当混合数据集的情况下，离线强化学习能够产生接近最优的强化学习策略。

Nov, 2023

感染性患者个性化血糖控制的表示学习与强化学习

本研究使用自编码器和强化学习方法，通过学习数据驱动的策略，确定重症感染病人的个性化最佳血糖控制方法，建立血糖水平与预计 90 天死亡率的关系，从而减少患者的预测死亡率。

Dec, 2017