Sep, 2021

DisCoDisCo 在 DISRPT2021 共享任务中的系统:话语分段、分类和连词检测

TL;DR该论文介绍了我们在 DISRPT2021 共享任务中的贡献,我们的系统 DisCoDisCo 基于 Transformer 的神经分类器,在上下文化的词嵌入上增加手工制作的特征,并依靠标记词序列的方法实现话语分割和联结检测,利用富有特征、无编码器的句子对分类器实现关系分类,我们的结果在前两个任务上优于上一次 2019 共享任务的 SOTA 成绩,并且在关系分类上的结果表明对 2021 年新基准测试具有强大的性能。消融实验表明,包括 CWEs 以外的特征对于两个任务都是有帮助的,多个预训练 Transformer 基于语言模型的局部评估表明,基于 Next Sentence Prediction(NSP)任务预训练的模型是实现关系分类的最佳选择。