Apr, 2024

SetCSE:使用对比学习的句子嵌入进行集合操作

TL;DR通过引用集合理论,我们提出了 SetCSE,一种创新的信息检索框架。SetCSE 使用集合来表示复杂语义,并结合提供的上下文进行结构化信息查询。在该框架中,我们引入了一种集合间对比学习目标,以增强对给定语义的句子嵌入模型的理解。此外,我们提供了一系列操作,包括 SetCSE 的交集、差集和操作系列,以利用增强模型的句子嵌入进行复杂句子检索任务。本文中,我们证明 SetCSE 遵循人类语言表达的约定,显著提高了底层句子嵌入模型的区分能力,并能够通过使用现有查询方法无法实现的复杂检索任务。