生成生物医学查询的解释
介绍了一个适用于实验的数据集 KB_Bio_101,它包含了大量的生物学知识,ASP 程序可以应用于其上,同时也提出了一些解决实际问题时 ASP 程序面临的挑战。
Dec, 2013
本文提出了一个用于自动生成解释的方法来改善基于管道的问答系统,在特定领域(如生物医学领域)中应用 QA 系统的难点在于其 “黑匣子” 性质,该方法是通过考虑三类(成功、无回答和错误回答)用于注释所涉及 QA 组件的输出,并选择一个模板解释来衡量其有效性。
Oct, 2020
提出了一种新的方法来为医疗问答系统预测的答案生成自然语言解释,通过提取医学教科书中的知识来增强解释的质量,实验证明了该方法在处理文本证据时的有效性。
Oct, 2023
本文针对生物数据的图形结构,以药物再利用的真实任务为例,利用强化学习和逻辑规则相结合的方法 PoLo 进行链路预测,超越了几种最先进的算法,并提供解释性。
Mar, 2021
Biomedical entity linking is improved using BioELQA, a model that treats it as multiple choice question answering, capturing fine-grained interactions and addressing challenges with long-tailed entities.
Feb, 2024
我们提出了一个新颖的系统,从生物医学语料库中自动提取和生成信息丰富、描述性的句子,促进相关知识的高效检索。与以往的搜索引擎或探索系统不同,我们的系统将描述性句子组织为关系图,使研究人员能够探索密切相关的生物医学实体(例如,化学品治疗的疾病)或间接相连的实体(例如,治疗疾病的潜在药物)。我们的系统还使用 ChatGPT 和经过微调的关系综合模型从检索到的信息中生成简明可靠的描述性句子,减少了对大量人工阅读的需求。通过我们的系统,研究人员可以轻松获得高层次知识和详细参考资料,并交互式地定位所需的信息。我们重点介绍了我们的系统在 COVID-19 研究中的应用,说明了它在药物再利用和文献整理等领域的实用性。
Oct, 2023
本研究介绍了 MedExQA,这是一个用于评估大型语言模型对医学知识的理解能力的新型基准,通过构建涵盖五个不同医学专业的数据集,并且为每个问题 - 答案对提供多个解释,填补了当前医学问答基准的一个重要空白,即缺乏模型生成细致医学解释的全面评估。我们的工作强调了医学语言模型可解释性的重要性,提出了一个评估模型超越分类准确性的有效方法,并在特定领域 —— 言语病理学中,揭示了当前 GPT4 等语言模型理解能力不足的问题。我们的结果表明,使用多个解释进行生成评估更符合人类评估结果,提供了一个更稳健的自动理解评估机制的机会。为了丰富开源的医学语言模型(目前主要基于 Llama2),我们还提出了一种新的医学模型 MedPhi-2,基于 Phi-2 (2.7B)。该模型在生成解释方面的性能优于基于 Llama2-70B 的医学语言模型,展示了它在资源受限的医学领域的有效性。我们将分享我们的基准数据集和训练好的模型。
Jun, 2024
本文介绍了完全由机器学习算法生成的第一个大规模公开生物医学知识图谱 Biomedical Informatics Ontology System(BIOS),包括生物医学术语的整理、同义词的计算识别、概念节点的聚合、语义类型分类、关系识别和医学机器翻译。结果提示,基于机器学习的 BioMedKG 开发是传统专家编纂的可行替代方案。
Mar, 2022
为了协助医学专家在日常活动中开发所需技术成为目前人工智能研究领域的热门话题。因此,最近提出了许多大型语言模型(LLMs)和自动基准,旨在利用自然语言作为人工智能与人类交互的工具,促进循证医学中的信息提取。本文提出了一个新的数据集,通过与以往研究不同的方式:(i)不仅包括正确答案的解释性论证,还包括解释错误答案不正确的论证;(ii)解释是由医生撰写的,以回答西班牙住院医师考试的问题。我们还利用这个新的基准来设置一项新的提取任务,即识别医生撰写的正确答案的解释。我们的设置的另一个好处是,我们可以利用提取问答范式来自动评估 LLMs 的性能,而不需要昂贵的人工评估。对西班牙语的语言模型进行了全面的实验,结果显示有时多语言模型的性能优于单语模型,甚至超过了已经针对医学领域进行调整的模型。此外,单语模型的结果不一致,表现竞争力的模型实际上更小、更低级。无论怎样,所获得的结果表明我们的新数据集和方法可以有效帮助医学专业人员识别与医学问题相关的循证解释。
Dec, 2023