ICLRMar, 2024

RAmBLA:一个评估 LLMs 在生物医学领域作为助手可靠性的框架

TL;DR我们引入了 RAmBLA 框架,评估了四种最先进的基于语言模型的助手是否能在生物医学领域中作为可靠的助手,并明确了快速性、高召回率和缺乏幻觉是这种使用情况的必要标准。