Oct, 2023

BooookScore:基于 LLMs 时代的图书摘要系统性研究

TL;DR通过两种工作流程 (层级合并、递增更新) 实现基于 LLM 的书籍摘要器的连贯性研究,发现 LLM 会出现八种常见的连贯性错误,并提出了一个自动评估指标 BooookScore,与人工标注结果一致,可用于系统评估其他关键参数的影响,同时节省了人工评估成本。