从连续的话语中学习对话的表征
本文提出一种对话导向的对比学习方法,即 DialogueCSE,以解决利用对话学习句子嵌入时出现的评估训练差距。通过引入新的匹配引导嵌入机制,该方法生成了上下文感知嵌入,并通过对比损失来最小化每个上下文感知嵌入与其对应的上下文无关嵌入的差异。实验结果表明,在三个多回合对话数据集上,该方法在 MAP 和 Spearman 相关性指标方面优于基线表现,具有很高的效力。
Sep, 2021
通过模板信息,利用自我学习的对比学习框架,构建模板感知的对话句嵌入方法 TaDSE,并通过合成增强数据集增强话语和模板之间的关系,数据实验结果表明 TaDSE 在五项基准数据集上均超越了现有最佳效果,并且意图分类任务的表现较一致。
May, 2023
本文提出了一种基于连续提示的差异感知深度对比句子嵌入方法(D2CSE),它可以区分相似句子的细微差异并在自我引导的情况下使用对比学习和条件替换令牌检测来执行多个任务,同时减少了训练参数数量,并且在语义文本相似度基准测试中达到了最新的表现水平。
Apr, 2023
本文介绍了 DiffCSE,一个无监督的对比学习框架,可以学习敏感于原始句子和编辑后句子之间差异的句子嵌入,通过朴素的掩码和掩码语言模型中的采样获得编辑后的句子,证明了 DiffSCE 是一种等变对比学习,并在语义文本相似性任务中取得了超越无监督 SimCSE 的最先进结果。
Apr, 2022
该研究介绍一种基于知识蒸馏的 Distilled Sentence Embedding (DSE) 模型,旨在通过构建一个用于重构跨注意力模型得分的基于句子嵌入的学生模型,加速计算查询 - 候选句子对的相似度并在句子表示基准测试中达到最先进的性能。
Aug, 2019
本文研究了对比学习中存在的偏见问题,提出了一种名为 DebCSE 的新型对比框架,通过逆倾向加权抽样方法选择高质量的正负样本对,以消除各种偏见的影响,从而提高句子嵌入的质量。在语义文本相似性基准测试中,DebCSE 的平均 Spearman 相关系数为 80.33%,显著优于最新的最先进模型。
Sep, 2023
本文提出了一种半监督句子嵌入框架 GenSE,通过使用大规模无标注数据,利用生成器 / 鉴别器模型进行句子对的合成和对比学习,实现对带标签和合成数据的句子表示学习,相对于目前最先进的方法,在四项领域适应任务上具有显着的性能提升,平均相关性得分为 85.19,证明了其高效性和一般化能力。
Oct, 2022
本文提出了一种新方法 RankCSE,将排名一致性和排名蒸馏与对比学习相结合,用于无监督学习句子表示,实现了语义区分的句子表示,该方法在语义文本相似性任务和转移任务中表现出优异的性能。
May, 2023
本研究提出了 SynCSE,通过利用大型语言模型合成数据样本,训练具有良好性能的句子嵌入,对比试验结果显示 SynCSE 在无监督基准模型的基础上具有更好的性能。
May, 2023