Jan, 2024
PROXYQA:使用大型语言模型评估长文本生成的备选框架
PROXYQA: An Alternative Framework for Evaluating Long-Form Text Generation with Large Language Models
Haochen Tan, Zhijiang Guo, Zhan Shi, Lu Xu, Zhili Liu...
TL;DR本研究介绍了 ProxyQA 框架,用于评估长文本生成能力,并通过评估器和生成的内容作为背景背景进行生成内容的质量评估,结果表明使用代理问题评估是一种高度自洽且与人工标准相关的验证方法。