May, 2024

GPT 能否重新定义医学认识?对生物医学机器阅读理解中的 GPT 进行评估

TL;DR我们评估了 GPT 在四个封闭式生物医学机器阅读理解基准测试上的表现,提出了一种名为 Implicit Retrieval Augmented Generation(IRAG)的提示策略,该策略通过减少传统 RAG 设置中使用向量数据库检索重要部分的需求来解决 LLM 所固有的检索问题,并通过定性评估展示了该方法的自然语言生成输出。实验结果表明,我们的新提示技术在四个数据集中有两个取得了最佳效果,并在其余两个中排名第二。实验还表明,像 GPT 这样的现代 LLM,即使在零 - shot 设置中,也能胜过监督模型,从而在两个基准测试中取得了最新技术水平的成果。