使用多尺度卷积神经网络学习立体模拟的相似性测度
该论文提出了一种基于神经网络的方法,通过学习与时间相关的二维数据集的相关性来计算数据的稳定泛化度量(LSiM),以用于数值模拟结果的比较。该方法应用连锁神经网络架构,通过对数值 PDE 解析器进行控制数据生成来提高数据多样性,其特殊损失函数允许对训练数据进行单个数据样本之间关联性的学习。同时,通过对多个测试数据进行实验,证明了该方法相较于其它现有的向量空间和图像度量方法有更好的效果。
Feb, 2020
本文提出了一个全新的知觉度量标准 DreamSim,通过人类相似度判断数据集的研究得出,该标准可以全面评估图片的相似性,更关注于前景物体和语义内容及对颜色和布局敏感,并且具有很好的一般性能。
Jun, 2023
本文围绕三维信息在物体分类中的重要性,通过改进现有的立体卷积神经网络和多视卷积神经网络结构,引入了基于多分辨率过滤的三维多视卷积神经网络,取得了比现有技术更好的分类效果,并提供了相关实验结果和设计思路分析。
Apr, 2016
本文提出了三种多尺度相似性学习结构,使用对比损失函数学习像素级匹配,实现对场景几何形态的无关性。基于深度学习,通过学习与分配匹配像素对,建立了混合和端到端方法之间的平衡。同时,文章还探讨了如何通过样本挖掘提高预测相似度的整体稳健性和较好的性能表现,并在航空和卫星数据集上进行了实验,结果表明 DeepSim 网络优于混合方法和端到端方法,并且更好地适用于未见过的场景几何形态。该灵活的体系结构可以轻松地应用于标准的多分辨率图像匹配管道。
Apr, 2023
通过使用 better calibrated to human perceptual judgments of image quality: the multiscale structural-similarity score (MS-SSIM) 进行训练而不是使用 pixel-wise loss (PL),提出了更好的 perceptually-optimized methods,已被证明在三种不同的自动编码器中表现更好,可以在图像分类和超分辨率成像方面为计算机视觉带来极大的潜力。
Nov, 2015
本篇论文提出两种方法来量化 CNN 潜在空间中语义信息的相似度,以解决模型透明性问题。通过将这些方法应用于三种不同的目标检测器和两个数据集,我们的研究表明相似的语义概念是在所有 CNN 体系结构中学习的,且相似的概念出现在相似的相对层深度中,而与总层数无关。该研究成果有望实现 CNN 模型选择的知情和语义信息处理的理解。
Apr, 2023
本文介绍了 ViSiL,一种视频相似性学习架构,它考虑了视频对之间的细粒度时空关系,包括了相似性评估之前的整个帧或整个视频的向量描述。通过卷积神经网络,我们从提炼的帧间相似性矩阵中计算视频间相似度,以同时考虑帧内和帧间的相似性。我们的方法避免了在帧之间的相似度计算之前进行特征聚合。我们使用三元组损失方案训练提出的网络,并在五个公共基准数据集上评估它,其中涵盖了四种不同的视频检索问题,结果表明,我们的方法比现有技术取得了显着的进步。ViSiL 的实现公开可用。
Aug, 2019