个人健康大型语言模型的研究
该研究探讨了大规模语言模型在多模态健康预测中的应用,通过上下文信息和生理数据进行综合评估,并展示了 fine-tuned 模型在健康预测任务中的表现和对上下文增强策略的有效性。
Jan, 2024
该研究展示大型语言模型能够通过只有少量的微调,在医疗和健康领域中处理不易表达为文本的各种生理和行为时间序列数据,并对心脏信号分析、身体活动识别、代谢计算和压力报告估计等健康任务进行有意义的推理。
May, 2023
使用大型语言模型(LLMs)综合多传感器数据生成临床有用的洞察力,首次展示使用 LLMs 进行二元抑郁症分类的准确性超过了现有技术,而且还强调了人工智能与医生领域专业知识和患者背景相结合的人工智能协同方法在临床决策支持方面的价值。
Nov, 2023
我们介绍了一种名为个人健康洞察代理(Personal Health Insights Agent,PHIA)的代理系统,它利用最新的代码生成和信息检索工具来分析和解释可穿戴设备中的行为健康数据。该研究对于推进行为健康在人群中的发展具有影响,有可能使个人能够解释自己的可穿戴设备数据,并为基于数据驱动的洞察力所支持的新型可获得的、个性化的健康管理方法铺平道路。
Jun, 2024
通过引入图增强型 LLM 框架,本文试图显著提高个性化和清晰度的健康洞察力,利用层次图结构捕捉病人间和病人内部关系,并丰富 LLM 提示信息,通过一个睡眠分析案例研究在 COVID-19 封锁期间涉及 20 名大学生,展示了我们的模型在有效生成可行和个性化健康洞察力方面的潜力,并利用另一个 LLM 评估了这些洞察力的相关性、完整性、可操作性和个性化程度,从而满足有效处理和解释复杂健康数据的模型的重要需求。我们的研究结果表明,使用我们的框架增强提示信息在所有 4 个标准下都取得了显著改进,通过我们的框架,我们可以产生量身定制、更慎重的回应,以适应特定的病人。
Jun, 2024
该研究通过开发一种名为 HeLM 的框架,使多模态大型语言模型 (LLMs) 能够使用高维临床模态来估计潜在疾病风险,并且在使用英国生物银行的数据进行验证时,HeLM 能够有效地利用人口统计学、临床特征和高维时间序列数据来估计疾病风险。
Jul, 2023
对大型语言模型在医疗保健行业的潜在价值进行了全面评估,发现 Google 的新型多模态模型 Gemini 在医学推理、幻觉检测和医学视觉问答任务中表现尚可,但在诊断准确性上低于 MedPaLM 2 和 GPT-4 等先进模型。分析结果显示 Gemini 对幻觉、过度自信和知识缺失高度敏感,需要谨慎部署。为提高性能,采用提示策略,并通过发布 Python 模块和建立医学领域 LLM 的排行榜促进未来研究与发展。
Feb, 2024
本研究旨在评估大型语言模型(LLMs)在医疗保健中的功效,特别关注它们在个人异常健康监测中的应用。我们的研究主要调查了 LLMs 在解释和分析来自 FDA 批准设备获取的生理数据方面的能力。我们在模拟低气压平台环境中进行了广泛的分析,评估了 LLMs 在理解和评估用户健康状况方面的精确性和可靠性。研究结果表明,LLMs 在确定医学指标方面表现出色,心率平均绝对误差小于 1 次 / 分,氧饱和度小于 1%,而这些评估的平均绝对百分比误差保持在 1% 以下,总体健康评估的准确率超过 85%。在诸如解释光电容积描记法(PPG)数据等图像分析任务中,我们专门适应的 GPT 模型表现出卓越的能力,心率周期计数误差小于 1 次 / 分,心率估算的平均绝对误差为 7.28。本研究凸显了 LLMs 作为健康数据分析工具和先进人工智能健康助手中的关键要素的双重角色,在未来的健康助手框架内提供个性化健康见解和建议。
Nov, 2023
数字卫生工具与大型语言模型(LLMs)结合可在临床环境中提供新颖的接口,增强数字医疗工具的实用性和实际影响,解决了使用 LLMs 时出现的问题,如幻觉,从而提高心血管疾病和糖尿病风险预测的效果。
Oct, 2023
通过评估 LLMs(GPT-4、Gemini 和 GPT-3.5)在诊断能力方面,本研究展示了它们如何显著提高医学诊断的准确性和效率,强调在应用 LLMs 于医疗和临床实践时需要更加关注患者隐私和遵守相关法规,以及研究人类偏见对 LLMs 任务的影响,为在复杂的医疗环境中应用人工智能提供新的可能性。
May, 2024