EMNLPNov, 2020

使用图论自动扩充的同义句数据集:寻找朋友和反转敌对者

TL;DR提出了一种基于图论的自动改进 NLP 数据集的方法,通过推断原始语句对的标签来构建同义词图,并使用结构平衡理论识别可能的错误标签,并在 BERT 模型的基础上对同义词模型进行训练,结果表明使用这种自动增强的训练集可以得到更准确的模型。