Feb, 2024

从实体中心的视角重新思考预训练的文本布局模型的评估

TL;DR我们介绍了一个用于评估 PTLMs 的信息提取能力的理想基准,并引入了 EC-FUNSD,一个用于评估语义实体识别和实体链接的实体中心基准,该数据集包含多种文档布局格式和语义驱动实体及其关系的注释。实验结果表明,最先进的 PTLMs 在现有基准上存在过拟合趋势,去除数据集偏差后,它们的性能明显下降。