- 简单而高效:面向自监督的统一样本特征对齐的局部区域特征匹配
通过引入双重权重共享网络、对比损失和可学习的自我注意力与交叉注意力相结合,实现了细粒度基于草图的图像检索方法的优化和扩展,并通过专业时尚草图和图像数据集 Cloths-V1 的验证展示了该方法的卓越性能。
- 对抗平衡自监督对比学习的可证明优化
研究自监督学习中公平编码器的学习,在这种情况下,所有数据都没有标签,并且只有其中一小部分数据带有敏感属性的注释。通过最小化无标签数据上的对比损失和最大化在具有敏感属性的数据上预测敏感属性的对抗损失,对抗公平表示学习非常适合这种情况。通过构建 - ICML可证明的对比式继续学习
通过对前一任务的训练损失进行理论分析建立了性能保证的理论解释并提出了一种新的自适应蒸馏系数的对比式连续学习算法 CILA,该算法在标准基准测试中取得了显著的改进和最新的最佳性能。
- AGRaME: 多向量嵌入的任意粒度排名
使用多向量嵌入在不同细粒度级别上进行排名,并通过多细粒度对比损失进行训练,最终将命题级别排名应用于检索增强生成中的事后引文添加,超越了基于提示的引文生成的性能。
- 可聚合的上下文化词向量用于有效短语挖掘
当目标短语位于噪音上下文中时,单个密集向量不足以进行有效的短语检索;因此,我们提出了代表多个子句、连续词语片段的概念,每个片段都有自己的密集向量,并引入了一种修改后的对比损失函数用于鼓励词嵌入具备此属性,并展示了该方法在短语挖掘中的改进效果 - 通过困难负例采样理解双曲度量学习
最近几年,将双曲几何方法融入计算机视觉领域的趋势日益增长。本研究调查了将双曲空间整合到度量学习中的效果,特别是在使用对比损失进行训练时。我们通过深入研究评估了使用混合目标函数的视觉变换器 (ViTs) 结果来解决现有文献中关于对比损失温度影 - 基于不确定性引导的无源域自适应与目标独立类别分离
该论文介绍了一种针对无源领域自适应的新方法,通过将目标领域的样本细分为多个未知类别来改善对目标专属样本的分离,并提出了一种名为 NL-InfoNCELoss 的新对比损失函数,可以增强模型对噪声伪标签的鲁棒性。实验结果表明,该方法在基准数据 - 温度网络遇见大型基础模型:通过 DRO 冷却还是不冷却?
本文提出了一个基于约束分布稳健优化(DRO)的有稳健性损失下的小而通用的温度预测网络(TempNet)的学习框架,并给出了相应的温度参数的定义和训练方法,实验证明 TempNet 可以显著改善现有解决方案或模型的性能。
- 无标签遗忘:深度模型的无监督遗忘
提出无监督学习方法,使用变分方法近似剩余数据的表示分布,并通过对比损失实现与原始模型表示的匹配,以实现深层模型中的遗忘与预测性能保留。
- ACL视觉 - 语言模型是否理解复合名词?
开放词汇视觉 - 语言模型(VLMs)如 CLIP 是一种有前景的文本到图像检索方法,然而,对于复合名词(CN)是否能像对待名词一样理解得好呢?本研究构建了 Compun 基准测试以评估 VLMs 在解释 CNs 方面的有效性,并深入分析了 - 使用大型语言模型生成的同类对等生成器进行外部分布检测
提出了一种名为 ODPC 的新方法,通过大型语言模型设计生成特定提示词来产生具有 ID 语义的 OOD 对等类,以便于检测,并采用基于 OOD 对等类的对比损失来学习紧凑的 ID 类别表示,并改善不同类别之间的界限清晰度。在五个基准数据集上 - WWW电子商务搜索中的层次化查询分类
通过增强的表示学习和细粒度实例关系的对比损失,以及关注内在标签分类法的细粒度层次分类损失,我们提出了一种新颖的框架来解决层次化查询分类的挑战,同时利用与已标注查询共享的无标签查询的相似性智能地选择这些查询以提高分类性能。实验证明,我们的方法 - 特征空间中的关联记忆
通过使用嵌入空间计算相似度,而不是像素空间,利用预训练的对比损失网络来计算嵌入,我们可以在较小的嵌入空间中更快地计算相似度分数,并且不需要存储整个数据集的像素空间。我们还提出了一种仅存储低维语义嵌入的记忆模型类别,并使用它们来检索类似但不完 - COSMO:简化的对比多模态流模型与交错预训练
在视觉语言预训练的演变过程中,从短文理解到包含扩展文本上下文具有关键作用。通过引入对比损失到文本生成模型中,本文提出了一种结合对比学习和多模态处理的统一框架 (ModelName),在涉及文本和视觉数据的任务中,显著提高模型性能,同时降低学 - AAAIAesFA:一种美学特征感知的任意神经风格迁移
该研究提出了一种轻量级但有效的模型,名为 AesFA,用于从参考图像中更好地解离美学风格,并通过在整个模型中进行端到端训练来完全排除预训练模型进行推理。为了改进网络提取更明显的表示和进一步增强风格化质量,该研究还引入了一种新的美学特征:对比 - StructComp: 在图对比学习中用结构压缩代替传播的训练
通过稀疏低秩近似方法,提出了一种名为 StructComp 的简单而有效的训练框架,用于解决图形对比学习的可扩展性问题,并在理论上证明了 StructComp 可以近似原始的对比损失,并改进了模型性能。
- 一段视频胜过万言:利用多样化字幕进行更好的长视频检索的训练和基准测试
通过对长视频生成多样的合成标题,使用大型语言模型评估长视频检索系统的能力,并提出轻量级微调方法(基于对不同标题中信息层级的差异进行对比损失学习),在下游的段落 - 视频检索任务以及使用合成数据计算的各种长视频检索度量上均有明显提升。
- 利用持久同调改进自监督分子表示学习
基于持久同调的自监督学习在分子表示学习中具有广泛的应用潜力,可以通过不同的数据视角、距离保持的稳定性和灵活性结合领域知识,提高嵌入空间的表示能力和预测性能,同时对非常小的数据集也能获得显著的改进。
- 多模态联合嵌入学习的外观编码
通过在生成建模的最新工作中使用外观编码,我们提出了一个框架,通过在不同模态之间施加对比损失约束来学习场景的外观和结构的联合嵌入空间,从而克服了需要在每次推理中重新训练新的外观编码的问题。通过将我们的框架应用于 RADIATE 数据集的简单变 - 利用输出对比损失进行语义分割的测试时间训练
通过适应输出对比损失(OCL)方法,在图像语义分割中提高模型对新领域的泛化能力,验证了该方法在不同评估场景下的有效性。