- 纹理引导的深度特征编码
通过纹理引导的特征压缩策略,该研究对机器视觉中的特征和纹理进行了调查和分析,提出了一种基于纹理特征的压缩策略,该策略通过选择性地压缩和传输与视觉任务相关的通道,同时为机器提供高质量的特征数据,并利用特征和纹理图像重建预览图像以支持人类决策。 - ICLRFeatUp:适用于任意分辨率的模型无关特征框架
使用一个多角度一致性损失函数,我们提出了 FeatUp,一种可以恢复深度特征中丢失空间信息的任务和模型无关的框架。通过保持原始语义,FeatUp 在现有应用中替换特征,从而取得了分辨率和性能上的提升,甚至无需重新训练,我们在类别激活图、分割 - 深度形状纹理统计完全盲目图像质量评估
利用深度特征和形状 - 纹理自适应融合的方法,通过内外形状 - 纹理统计间的变量马氏距离量化感知质量,在人工和真实图像畸变上取得了最先进的质量预测性能。
- 一个示例下的扩散过程中的代表性特征提取
DiffSketch 是一种从图像中生成各种风格化素描的方法,通过从预先训练好的扩散模型中选择代表性特征,我们的方法专注于从深层特征的丰富语义中选择。这种新颖的素描生成方法可以通过一个手绘图进行训练,通过将经过训练的生成器提炼成简化的提取器 - 基于 Transformer 的选择性超分辨率用于高效图像精炼
通过将图像分割为不重叠的图块、使用金字塔结构选择感兴趣的图块,并利用深度特征仅重构这些选定的图块,我们提出了一种新颖的基于变压器的算法 Selective Super-Resolution(SSR),解决了常规超分辨率方法在放大整个大图像时 - 基于多标签联合解码的层次音视频信息融合在 MER 2023 上的应用
我们提出了一个用于识别离散和维度情感的新框架,通过从基础模型中提取的深度特征作为原始视频的鲁棒声学和视觉表示,设计了三种基于注意力引导特征汇集的不同结构用于深度特征融合,并在解码阶段引入了联合解码结构用于情感分类和价值回归。我们还设计了基于 - 优化的深度特征选择用于肺炎检测:一种新的 RegNet 和基于 XOR 的 PSO 方法
通过使用基于异或运算的粒子群优化算法从 RegNet 模型的倒数第二层中选择深度特征来改进卷积神经网络 (CNN) 模型对肺炎检测的准确性,本研究提出了一种能够对儿童肺炎进行自动检测,从而在资源和专业知识有限的发展中国家中显著减少儿童死亡率 - 室内场景识别的语义引导上下文建模
本文提出了一种基于语义分割的新方法 SpaCoNet,旨在同时模拟对象的空间关系和共现情况,进而在室内场景识别任务中生成语义引导的特征表示,该方法具有良好的通用性和效果。
- ImLoveNet: 面向低重叠点云配对的图像支持非对齐配准网络
提出了一个利用中间图像辅助点云配准的方法 ImLoveNet,通过学习跨不同模态的深度特征以及两阶段分类器,得到高置信的重叠区域来进行配准,该方法简单有效,无需摄像机的外参信息,并在多项基准测试中取得了优于其他方法的表现。
- 无参考特征是否有助于全参考图像质量估计?
该研究探索在全参考图像质量评估任务中利用无参考特征,通过对比和参考图像的深度特征对失真图像进行像素级对比可能没有意义
- ICCV多尺度匹配网络用于语义对应
本文提出了一种多尺度匹配网络,该网络可以对邻近像素之间微小的语义差异进行敏感的多尺度匹配,并利用深度卷积神经网络的多尺度结构学习判别像素级特征。实验结果表明,该方法在三个流行的基准测试上具有高计算效率并达到了最先进的性能。
- 多源特征无监督视频摘要
本文提出了通过结合多种特征源进行特征融合的视频摘要算法,该算法在两个基准测试数据集 TVSum 和 SumMe 上取得了最新的研究结果,并对以往的研究方法进行了评估,同时进行误差分析以找出导致分类错误的因素。
- CVPR单室内全景布局指导的新视角合成
本文提出一种从单个室内全景图生成新视角的方法,在使用卷积神经网络提取深层特征和估计深度图的基础上,利用室内场景的布局信息指导目标视角图像的生成,并加入几何约束以提高一致性和鲁棒性。实验结果表明,该方法在小大相机移动下均有较好效果。
- MM利用正常模型的转移学习框架进行异常检测
本文提出了一种基于相似性度量将深度卷积神经网络作为特征提取器用于异常检测的迁移学习框架,并通过对工作点决策阈值的优化来提高检测准确率。
- 从手工制作到深度特征:行人检测综述
本文概述了近年来关于行人检测的研究进展,主要包括采用手工特征和深度特征的方法,单通道和多通道行人检测的研究,以及相关数据集和评价指标的介绍。作者还强调了当前需要解决的问题和未来的研究方向。
- ECCV使用隐式特征网络从部分 3D 数据进行纹理补全
本研究旨在实现通过 IF-Nets 模型进行基于局部和全局深度特征提取,从部分三维纹理和已完成几何体上完成 3D 纹理的完整。我们的模型成功地用靠近已完成几何体的内插法来处理丢失的纹理部分,并在 SHARP ECCV20 挑战中取得了最高表 - 深度几何纹理合成
本研究提出了一种新的框架,用于学习几何纹理统计知识以生成具备放射性的深层特征,使得可以实现在不同层次上的网格顶点位移及纹理转移。
- 通过零通道剪枝实时高分辨率图像的通用风格转移
本文提出了一种基于 ArtNet 的,在风格转移应用特别设计的零通道修剪算法以及一种理论上有根据的三明治交换变换(S2)模块,可以实现高分辨率图像上的通用,实时和高质量的风格转移。经全面实验验证,ArtNet 能够同时实现 68.03 FP - CVPR通过跨视角匹配实现联合位置和方向估计
本文提出了一种动态相似度匹配网络,通过使用极坐标变换来大致对齐空中图像,学习地面和变换后空中图像的深度特征,并通过计算跨视图特征之间的相关性来获得定位时的方向,从而提高了十字视图地理定位准确性。
- CVPR学习优化非刚性跟踪
通过内嵌学习算法的方式,对非刚性追踪问题进行优化,提高动态物体跟踪稳健性和求解器的收敛速度,实现了利用 CNN 学习特征进行全局形变的捕捉和快速生成预条件矩阵,在计算复杂度和实验结果方面胜过原算法。