May, 2023

让大型语言模型能够生成带有引文的文本

TL;DR这项研究介绍了 ALCE,一个自动化 LLMs 引用评估的评测基准,通过自动度量三个维度 - 流畅度、正确性和引用质量,强调了更好的检索器、长文本 LLMs 等方向的改善空间。