ACLJun, 2024

M-QALM: 通过问答评估大型语言模型在临床阅读理解和知识回忆方面的能力

TL;DR研究了大型语言模型在临床和生物医学领域中与相关知识的召回和整合性方面的性能,发现指导调优等因素能够提高召回和理解能力,并展示了在医学知识数据集上进行直接微调的鼓舞人心的结果,为语言模型中的临床知识表示学习的进一步发展提供资源和标准方法论。