May, 2024

医疗领域生成型大型语言模型人工评估的文献综述与框架

TL;DR该研究回顾了健康医疗领域中基于大型语言模型的人工智能生成文本的人工评估方法,并使用QUEST框架提出了一个标准化和统一的人工评估方法,旨在提高可靠性和适用性。