- 面向时空视觉注意建模与理解的分层表示
该篇博士论文研究和开发了用于视频序列中的时空视觉注意建模和理解的分层表示。具体而言,我们提出了两个用于视觉注意的计算模型。首先,我们提出了一个上下文感知的生成概率模型,用于视觉注意建模和理解。其次,我们开发了一个深度网络架构,用于视觉注意建 - 基于生成神经网络的超高维非凸全局优化
我们提出了一种非凸优化算法元启发式方法,基于深度生成网络的训练,能在连续、超高维度的空间中实现有效搜索。通过网络训练,利用采样的局部梯度种群在定制的损失函数内,将网络输出分布函数演化朝向高性能最优点的一个峰值。深度网络架构根据训练过程进行渐 - CVPR航空 LiDAR 扫描下稠密植被的多层建模
利用多层次结构的 LiDAR 对野生森林进行 3D 注释,提出了一个同时预测 3D 点云标签和高分辨率层占用栅格的深度网络结构,以此实现对每层厚度和相应的闭合网格的精确估计,并发布了相关数据集和模型。
- 一种使用简单数据增强技术的全面依赖文本的端到端发音错误检测和诊断方法
本文提出了一种新颖的文本依赖模型来利用前置文本,通过注意力机制将音频与前置文本的音素序列对齐,来实现完全的端到端结构,同时提出了三种简单的数据增强方法来缓解模型捕捉错读音素的能力问题,并在 L2-ARCTIC 数据集上表现出 56.08% - U$^2$-Net:嵌套 U 结构深度增强的显著目标检测
该论文使用深度网络架构设计了 U$^2$-Net 来进行显著对象检测,其优点是可以在不显著增加计算成本的前提下增加整个结构的深度,并能够从不同的尺度捕获更多的背景信息。
- 基于群组的深度共享特征学习用于细粒度图像分类
该论文提出了一种新的深度神经网络架构 —— 基于组的深度共享特征学习(GSFL)网络,实现了特征的共享和鉴别性部分的分离,大幅提高了细粒度图像分类的准确率。
- 车辆再识别的属性引导特征学习
本篇论文提出了一种利用有意义的属性指导(例如相机视角、车辆类型和颜色)的新型深度网络架构来解决车辆再辨识中的问题,并设计了一种特定视角的生成对抗网络来生成多视角车辆图像。实验结果表明,该方法在 VeRi-776 和 VehicleID 数据 - 这像那样:用深度学习进行可解释的图像识别
介绍了 ProtoPNet,一种深度神经网络架构,该模型通过识别图像的原型部分并将原型部分的证据结合起来,类似于鸟类学家、医生和其他人解决图像分类任务的方式,提供了一定程度的可解释性,并在 CUB-200-2011 数据集和 Stanfor - 使用文本和草图学习跨模态深度嵌入进行多对象图像检索
本文介绍了一种跨模态图像检索系统,允许文本和草图作为查询的输入模态。使用跨模态深度网络架构共同建模草图和文本输入模态以及图像输出模态,通过学习文本和图像之间以及草图和图像之间的共同嵌入,使用注意力模型有选择性地关注图像的不同对象,可以实现多 - 多粒度学习区分特征在行人再识别中的应用
本文提出了一种多粒度深度网络 MGN,将全局特征与多种局部特征相结合,将图像实现均匀划分为多个条带进行训练,进一步提高了人物再识别任务的性能表现。在包括 Market-1501、DukeMTMC-reid 和 CUHK03 等主流评估数据集 - ECCV学习在虚拟世界中检测和跟踪可见和遮挡的身体关节
该文章提出了一种新的深度网络架构,它可以跟踪城市场景中的多个人物并解决遮挡问题,同时使用计算机图形学的数据集进行训练,取得了良好的跟踪效果。
- CVPRDR-Net:弱监督细化引导的传输定向单图去雾网络
提出了一种名为 DR-Net 的新型深度网络架构用于图像去雾,其由三个主要子网络组成:预测输入图像的透射率图的传输预测网络、重构由透射率图驱动的潜在图像的去雾网络和通过弱监督学习增强去雾结果的细节和颜色特性的优化网络。与先前的方法相比,我们 - LS-VO:学习稠密光学子空间用于鲁棒地视觉里程计估计
本文提出了一种新颖的深度网络结构来解决相机自我运动估计问题,并使用自编码器网络找到光流场的非线性表示,从而显著提高了估计性能。
- 视频和球面图像的艺术风格转换
本文提出了两种计算机视觉算法对图像和视频进行风格迁移,第一种是根据 Gatys 算法进行能量最小化的图像风格转移技术,针对图像中的规模和遮挡等问题提出了改进,第二种是将视频风格迁移建模为一个学习问题,使用深度学习网络和新的训练程序使其在几乎 - 动态可扩展网络下的终身学习
本研究提出了一种名为 DEN (Dynamically Expandable Network) 的深度网络架构,可以在学习一系列任务时动态决定其网络容量,从而学习任务之间的重叠知识共享结构,通过选择性重新训练、动态扩展网络容量和时间戳来有效 - NIPSDeep Sets
研究设计用于基于集合的机器学习任务模型的问题,提出一种特殊结构的函数族,设计可以在未监督和监督学习任务中应用的深度网络架构,并演示了在人口统计估计,点云分类,集扩展和异常检测等任务上的应用。
- CVPR卷积神经网络的非局部彩色图像去噪
本研究提出了一种基于非局部图像模型的新型深层网络结构,用于灰度和彩色图像去噪,并通过实验验证,表明该非局部模型在所有测试噪声水平下均实现了最佳的去噪性能,同时能够与卷积神经网络进行直接连接,并利用深度学习中 GPU 计算的最新进展,在其固有 - 从面部表情识别到人际关系预测
本研究旨在研究是否可以从生活场景中的人脸图像中对人际关系进行细分和高水平特征的表征和量化,并提出了一种采用深度网络架构来识别面部表情的方法,以预测人际关系,并展示出了良好的实验结果。
- ECCVLIFT:学习不变特征变换
介绍一种新颖的深度网络架构,实现了完整的特征点处理流程,包括检测、方向估计和特征描述,并展示了其在多个基准数据集上超过现有方法的性能表现,同时不需要重新训练。
- ECCV从一张图像中深度估计遮挡
本文提出了一种名为 DOC 的深度网络架构,它能在单个图像上检测物体边界并估计边界所有权,可用于恢复遮挡关系,并通过大规模实例遮挡边界数据集 PIOD 进行了验证。