Mar, 2022

一句话价值128伪标记:一个针对句子嵌入的语义感知对比学习框架

TL;DR本文提出一种基于伪符号Bert(PT-Bert)的语义感知对比学习框架,可以有效地利用句子的伪符号空间表示,消除了句子长度和语法等表征对模型的影响,实现了对未标注文本的编码。通过构建同长度的正负样本对进行对比学习,我们的模型在六个标准语义文本相似性(STS)任务中优于现有的基准模型。