Apr, 2024

FABLES:评估长篇书籍摘要的忠实性与内容选择

TL;DR通过对虚构书籍的长篇小说生成概述的大规模人类评估,本论文揭示了长篇大语境语言模型在生成摘要时的忠实度和内容选择方面的问题,并且提出了检测生成的摘要中不忠实内容的重要性,同时也探讨了在书籍概述中与关键故事元素相关的遗漏错误以及朝末尾发生事件的系统过度强调。