ACLApr, 2024

什么导致显式到隐式篇章联系识别失败?

TL;DR我们的研究揭示了,关系分类器在去除连接词后通过明确的示例进行训练在隐含场景中表现不佳的原因之一是标签偏移。通过在语料库级别提供经验证据,我们证明了标签偏移的存在,并通过考虑连接词的句法角色、连接词的歧义性等因素,分析了标签偏移发生的原因。最后,我们研究了两种缓解标签偏移的策略:过滤噪声数据和与连接词的联合学习。在 PDTB 2.0、PDTB 3.0 和 GUM 数据集上的实验表明,使用我们的策略训练的分类器优于强基线模型。