Feb, 2024

ANLS*- 生成式大语言模型通用文档处理度量

TL;DR该论文介绍了一种用于评估生成模型的新度量指标 ANLS*,扩展了现有的 ANLS 度量,适用于信息提取和分类等各种任务,并通过评估 7 个不同数据集和 3 个不同的生成模型,证明了该度量指标的重要性。此外,还对一种新型的文档提示生成技术 SFT 进行了评估,并与其他提示技术(如 LATIN)进行了比较。在 21 个案例中,SFT 在 15 个案例中超过其他技术,提升了最新技术水平,有时可高达 15 个百分点。