- CVPRPUDD:面向鲁棒的多模态原型深度伪造检测
提出了一种基于相似性的检测系统,通过将输入数据与已知原型进行比较,分析相似度降低,来进行视频分类,识别潜在的深度伪造图像或之前未见过的类别,PUDD 在 Celeb-DF 上达到 95.1% 的准确率,表现优于最先进的深度伪造图像检测方法, - 关于逐层表示相似性的研究:用于具有单个分类器的多出口模型的应用
我们研究了 transformer 模型中隐藏层之间的表示相似性,并展示了一个简单的样本级余弦相似度度量能够捕捉到这种相似性,并与复杂的统计方法 CCA 一致,通过提出对齐训练方法,我们增强了内部表示之间的相似性,并得到了具有多个隐藏层输出 - 关于语言编码器间的仿射同伦
预训练语言编码器的相似性及其对下游任务性能的影响进行了分析,发现了仿射对齐的特性以及其对外在相似度的启示,从而揭示了预训练编码器空间的结构。
- 相似性不是唯一的需求:为具有多层思维的检索增强生成赋能
大型语言模型近年来在各个领域取得了显著成就,然而,知识更新的及时性和成本以及语言模型的幻觉问题等因素限制了其在知识密集型任务中的应用,而检索增强生成可以提供帮助。因此,本研究提出了一种名为 MetRag 的多层思维增强的检索增强生成框架,综 - TS3IM:通过图像相似性评估揭示时间序列的结构相似性
时间序列分析中,精确测量相似性对于预测、异常检测和聚类等应用至关重要。本文引入了一种基于结构相似性指数度量的时间序列结构相似性指标测量(TS3IM),通过评估趋势、变异性和结构完整性等多个维度的相似性,提供了更细致和全面的测量方法。这一新指 - 基于相似性的类比比例
该论文通过在普适代数的一般框架内引入抽象代数的类比比例和相似性,旨在建立从相似性到类比比例之间的桥梁,通过将后者用前者来表述。这种基于相似性的方法的好处在于比例和相似性之间的联系已经融入到框架中,因此显而易见,这很吸引人,因为比例和相似性都 - 探讨相似性在检测伪装文件中的作用
相似性在安全应用领域广泛应用,我们研究了仿冒样本的问题,发现这些样本可能对机器学习解决方案造成重大问题。我们进一步研究了数字签名与机器学习解决方案之间的相互作用,特别关注可执行文件和代码签名,并提出了一种仿冒文件的分类方法。我们利用相似性和 - 通过复杂性约束的描述性自编码实现可解释的概念相似度度量
图像相似度的量化是图像机器学习的一个关键版权问题。本文提出了一种基于概念相似性的图像相似度度量方法,通过生成逐渐复杂的图像描述来衡量相似度,该方法在图像对比和文本对比中表现优于现有基准,并通过指示差异描述粒度提供了解释性。
- 音频嵌入中的节奏操作用于节奏预测和搜索的相似但更快方法
通过对音频嵌入空间的节奏操纵,实现了一种可以在维持其他性质的同时检索具有不同节奏的相似音轨的函数,该函数可用于训练下游节奏预测器和改进与节奏无关的特性的最近邻检索的有效数据增强策略。
- 一种公理化的无关模型概念解释方法
本研究提出了一种满足线性性、递归性和相似性三个重要公理的模型无关的概念解释方法,并与先前的概念解释方法建立了联系,实验证明了该方法在模型选择、优化器选择和使用一种启发式编辑方法改进零样本视觉语言模型方面的实用性。
- 单目相机在 3D 生物特征识别中的最新进展
探讨了利用单目视觉进行 3D 生物特征识别的最新研究进展,包括相似性、挑战和采用新技术进行 3D 生物特征识别的应用系统以及该领域的研究问题。
- 强传递关系与图神经网络
本研究通过扩展相似性的概念,从邻近社区延伸到整个图形,并引入了基于传递性关系的相似性扩展,使得图神经网络能够捕捉整个图形上的全局相似性和局部相似性。我们提出了 Transitivity Graph Neural Network(TransG - 评估问卷数据的无监督学习方法 —— 从测量不变性的违反中获取的见解
本文提出了一种基于无监督学习的研究数据处理方法,通过数据准备、问卷聚类和基于聚类结果及每个群组属性的相似性度量,实现了对不同群体之间的自然比较和响应模式的自然描述,并可以安全地应用于各种数据集,即使在不存在测量不变性的情况下。此方法将 (测 - 测量大型语言模型的表示相似性
对大型语言模型之间的相似性进行了研究,发现有些模型之间存在显著的差异。揭示了使用相似性评估得出虚假结论的挑战以及需要进行仔细研究的必要性。
- 学习为神经参数分配搜索编写超参数
神经参数分配搜索(NPAS)通过在给定任意固定参数预算的情况下获取网络权重来自动化参数共享。我们改进了先前工作中的两个主要缺点,首先是在搜索和训练步骤之间共享模式的不一致性,其在搜索期间对不同大小的层进行权重变形以衡量相似性,但在训练期间不 - EMNLPCLAIR: 使用大型语言模型评估图像标题
CLAIR 是一种新颖方法,利用大型语言模型(LLMs)的零 - shot 语言建模能力来评估候选图像标题,与现有方法相比,CLAIR 在与人类判断相符的标题质量方面表现出更强的相关性,能够清晰解读结果与其分配的分数背后的推理过程。
- 高效的基于内容的时间序列检索系统
我们提出了一种有效且高效的基于内容的时间序列检索模型,超越了其他模型,在提供合理的推理运行时间的同时,展示了解决业务问题的能力。
- 时间序列分析的同胚变换:非线性扭曲的高效方法
这篇论文提出了一种新颖的弹性对齐方法,采用参数化和可微分的扭曲变换来克服动态时间规整(DTW)度量的不足,该方法适用于深度学习架构,鲁棒性强,具有计算效率高、表达和灵活性强等优点。
- 出人意料:相似度评分的对比效应
通过提出 “惊喜得分”,一种集合标准化相似性度量方法,提高零样本和少样本文档分类任务的性能,相比原始余弦相似性,通常可以达到 10-15%的更好性能。
- 弱监督下的孪生网络人体活动识别
本文提出了一个由多个孪生网络组成的模型,仅使用关于数据样本对之间相似性的信息进行训练,而无需明确标记的数据样本,从而将活动数据样本映射为固定大小的表示向量,使表征空间中的向量之间的距离近似于输入空间中数据样本的相似性,因此该训练模型可以作为