ACLJun, 2024

基于语言条件的语义文本相似度

TL;DR通过重新注释 C-STS 验证集,并经过全面的数据集分析,我们改进了 C-STS 任务,利用模型理解 QA 任务设置中的条件,从而生成答案,并提出了一种自动错误识别流水线,能够以 80% 以上的 F1 得分识别 C-STS 数据中的注释错误。此外,我们还提出了一种新方法,通过将答案与模型进行训练,大大提高了 C-STS 数据上的性能。最后,我们讨论了基于实体类型的条件性注释方法,并展示了实例中,基于类型 - 特征结构 (TFS) 的方法能够为构建具有新条件的 C-STS 数据提供语言基础。