BriefGPT.xyz
Ask
alpha
关键词
llm-based automatic evaluation
搜索结果 - 1
基于大型语言模型的可控指令摘要生成与评估能力基准测试
语言模型在标准的概括基准测试中已经取得了强大的性能,但在更复杂的概括任务设置上的表现却鲜少被研究。本研究基于指令可控的文本概括对语言模型进行评估,并使用多种评估协议和多个语言模型进行了自动评估。研究结果表明,指令可控的文本概括对于语言模型仍
→
PDF
8 months ago
Prev
Next