COLINGMar, 2024

核指解析模型的有控重评

TL;DR通过系统评估五个核心指代消解模型并控制每个模型使用的预训练语言模型,我们发现在语言模型大小相同的情况下,基于编码器的核心指代消解模型在准确性和推理速度方面优于更近期的基于解码器的模型,并且我们测试的最古老的核心指代消解模型在跨领域文本体裁中表现最好。最后,我们得出结论:控制语言模型的选择可以减少过去五年间 F1 分数的增长,尽管无法完全消除该增长。