利用文本嵌入模型和向量数据库作为文本分类器的例子 —— 以医疗数据为例
大型语言模型(LLMs)在各种自然语言处理任务中表现出令人惊讶的性能。最近,结合领域特定知识的医学 LLMs 在医疗咨询和诊断方面展现出卓越能力。本文系统地探讨了如何基于通用 LLMs 训练医学 LLMs,并提供了指导各种医学应用的 LLMs 发展的方法。
Jun, 2024
使用向量嵌入从单模态基础模型和多模态视觉语言模型来进行低资源环境下的多模态深度学习,特别是在医疗领域中。将这些方法与传统方法进行比较,评估它们对计算效率和模型性能的影响,使用精度、F1 分数、推理时间、训练时间和内存使用等指标。结论表明,嵌入降低了计算需求而不影响模型性能,我们提出的对齐方法提高了医疗任务的性能。通过优化受限环境中的资源,此研究促进了可持续的人工智能实践,并突显了基于嵌入的方法在高效多模态学习中的潜力,提升了人工智能在各种用例中的适应性。
Jun, 2024
使用大型语言模型(LLMs)进行医疗领域各种任务的工具和解决方案的使用日益增多,然而在这个高度关键和敏感的领域中,它们的稳健性以及所生成结果的可信度已经引起重要的问题。本研究通过构建基于 ICD-10-CM 代码描述的文本数据集来回答这些问题,该代码广泛应用于美国医院并包含许多临床术语及其易于复述。然后,我们对现有的嵌入模型进行了基准测试,无论是专门针对临床领域的模型还是通用模型,在一个语义搜索任务中,目标是将复述文本正确匹配到原始描述。我们的结果表明,通用模型的表现优于临床模型,这表明现有的临床专门模型更加敏感于输入的微小变化,从而使它们感到困惑。临床专门模型的突出问题可能是因为它们在训练时数据不够充分,特别是在没有足够多样化的数据集进行全局语言理解的情况下,而这对于准确处理医疗文档仍然是必要的。
Jan, 2024
大型语言模型在医疗保健领域的部署引发了热情和忧虑,本综述论文探讨了针对医疗保健应用设计的现有大型语言模型的功能,从传统的预训练语言模型到目前的医疗保健领域的大型语言模型发展轨迹,特别关注临床语言理解任务的潜力以及性能评估、挑战和限制。
Dec, 2023
文中提出了使用专家领域知识来构建单词嵌入向量的方法,在临床自然语言处理中获得了可观的效果。通过将单词的 “上下文” 概念推广为包括任意特征,我们展示了使用这种方法产生的单词向量在与临床专家的相关性方面普遍优于其纯文本的对应方法。
Dec, 2017
使用大规模多模态医疗数据集,本文提出了一种新的 cui2vec 医疗概念词嵌入模型,并通过统计功率法进行了评估,结果表明该模型在大多数情况下相对于之前的方法具有最先进的性能。
Apr, 2018
通过对八种流行的大型语言模型在三个临床病例描述数据集上进行严格评估和分析,我们发现这些模型在受保护群体之间存在各种不同程度的社会偏差,而大小模型并不一定比通用模型更具偏见,经过设计决策的提示方式对社会偏差也有影响,研究呼吁对在临床决策支持应用中使用的大型语言模型进行进一步评估、审查和改进。
Apr, 2024
在这篇论文中,我们回顾了大型语言模型(LLMs)的发展,重点关注医学 LLMs 的需求和应用。我们提供了现有模型的简要概述,旨在探索进一步的研究方向并使其对未来医学应用产生益处。我们强调了医学 LLMs 在应用中的优势,以及其发展过程中遇到的挑战。最后,我们提出了技术整合的方向来减轻挑战,并为医学 LLMs 的未来研究方向提供了建议,旨在更好地满足医学领域的需求。
May, 2024