图像相似度的量化是图像机器学习的一个关键版权问题。本文提出了一种基于概念相似性的图像相似度度量方法,通过生成逐渐复杂的图像描述来衡量相似度,该方法在图像对比和文本对比中表现优于现有基准,并通过指示差异描述粒度提供了解释性。
Feb, 2024
通过模拟时间序列的视觉经验,结合既视感与语言的对齐,我们的研究表明时间和既视感对齐是解释人类某些形式的语义知识起源的可能计算原理。
Apr, 2024
本篇论文提出了一种称为 “条件相似性网络” 的方法,用于学习分离式嵌入,不同的相似性概念被编码在不同的语义子空间,并用于解决多个不同相似性概念的问题。
Mar, 2016
本论文介绍了一种文本视觉背景数据集,用于改进现代图像描述系统,通过融合与场景相关的文本信息,提高图像描述的准确性及语义关联性。
Jan, 2023
基于标注数据的 A:R vs B:R 方法构建了图像相似度模型,并采用集成模型处理稀疏采样和基于上下文数据的偏差,测试结果表明,该集成模型优于单个上下文敏感模型、混合图像数据和现有相似度模型,证明基于上下文标注和模型训练在适当的集成方法下可以有效克服稀疏采样的限制。
Jan, 2024
提出了一种基于内容的图像检索方法,通过构建视觉层次结构来捕捉视觉和语义的相似性,将其融合到相似度搜索的距离计算度量中,实验证明该方法在图像检索方面具有优越性能。
Aug, 2023
本研究从相似性分析的角度调查了语境词表示模型。使用现有和新的相似性度量标准,旨在评估深度模型中信息局部化的程度,并有助于调查哪些设计因素影响模型相似性,而无需任何外部语言注释。分析发现,同一系列的模型彼此更相似,而不同的体系结构具有相似的表示,但有着不同的神经元。我们还观察到更低层和更高层的信息本地化差异,并发现更高层受下游任务的微调影响更大。
May, 2020
本文提出 AVSL 框架,用于更精确和可解释地衡量图像之间的相似度,通过基于人类语义相似性认知构建通用相似性学习范式,使用图形以及自下而上的相似性构建和自上而下的相似性推断框架,在语义层次一致性的基础上推断相似性,取得了显著的改进,并验证了框架的可解释性。
Mar, 2022
本文提出了一个全新的知觉度量标准 DreamSim,通过人类相似度判断数据集的研究得出,该标准可以全面评估图片的相似性,更关注于前景物体和语义内容及对颜色和布局敏感,并且具有很好的一般性能。
Jun, 2023
本文提出一种改进图像 - 字幕生成系统的方法,通过从视觉上下文的角度修订语言生成输出的 beam search,采取视觉语义量化概念,在单词和句子级别上匹配与图像相关的信息来选择最相关的输出作为字幕。该方法可作为后处理方法应用于任何字幕系统中。
Sep, 2022