Oct, 2024

大型语言模型在自然语言生成评估中的积极批评者

TL;DR本研究解决了当前自然语言生成评估中,使用大型语言模型作为“被动批评者”的局限性,提出了一种新颖的“积极批评者”评估协议。该协议允许大型语言模型自我推断任务并动态优化评估标准,实现了与人类评估标准的更强一致性,并在多个评估任务中展现出其有效性和可解释性。