Nov, 2023

为高效和通用的超细实体类型定义校准的 Seq2seq 模型

TL;DR使用 CASENT 模型,采用序列到序列方法,并预测带有经过校准的置信度分数的超精确类型,通过在 UFET 数据集上的实验证明其在 F1 得分和校准误差方面优于现有最先进方法,同时推断速度提高了 50 多倍,并在零样本和少样本情况下,在五个专业领域实体类型数据集上展示了其泛化能力,惊人的是,在零样本设置下,我们的模型在超过 10 倍参数的大型语言模型上取得了更好的性能,在使用 50 个示例进行微调时,它在所有数据集上显著优于 ChatGPT。