- 为视频物体分割提出三维卷积的论点
本文提出了一种基于 3D 全卷积神经网络的编码 - 解码网络结构,将其应用于视频中的显著对象分割。尝试使用全 3D 卷积来处理外观和运动信息从而实现密集视频预测,并通过 3D 全局卷积层和 3D 细化模块进行编码和解码操作。作者将其应用于 - 性别倾斜:通过属性操作实现计算机视觉模型的反事实公平性
本文提出了一种使用编码器 - 解码器网络开发的人脸图像合成方法,以测量商业计算机视觉分类器的反事实公平性,并报告了在线搜索服务中与职业相关的关键字中出现的偏向性,用以解释模型偏差的来源。
- CVPREPOS:对具有对称性的物体估计 6D 姿态
通过使用编码器 - 解码器网络以及 PnP-RANSAC 算法,估算单张 3D 模型可得的 RGB 输入图像中刚性对象的 6D 位姿,对具有全局或部分对称性的挑战性物体采用紧凑表面片段进行表示。
- 神经机器翻译:综述与调查
本文追溯了现代神经机器翻译体系结构的起源,重点探讨了单个神经网络在翻译中的应用,其中涉及到 word 和 sentence embedding 以及编码器 - 解码器网络家族的早期示例,并总结了该领域的最新趋势。
- ICCV视频中实时人脸去识别
本研究提出了一种面部去识别方法,能够实现高帧速率的全自动视频修改,通过一种新型前馈编码器 - 解码器网络架构,在保持姿势、照明和表情不变的同时,尽可能最大程度减弱身份气息,网络具有全球性,能创建自然外观的图像序列,时间扭曲少。
- SESF-Fuse: 多焦点图像融合的无监督深度模型
本研究提出了一种基于无监督深度学习模型的多焦点图像融合方法,该方法通过训练编码器 - 解码器网络获得输入图像的深层特征,并使用这些特征及空间频率来衡量活动水平和决策图,最终应用一些一致性验证方法来调整决策图并得出融合结果,与之前的方法相比, - 单视角三维重建网络学习什么?
该研究提出了两种替代方法进行单视图对象重建,并证明了编码器 - 解码器方法与这些基线方法在统计上是无法区分的,从而表明当前单视图对象重建技术实际上是在进行图像分类,而非重建。同时,研究者还发现了实验程序中存在的一些问题,并提出了改进方法。
- CVPR图像修复的多级编码器 - 解码器架构
本研究提出了一种基于编解码器网络的多层扩展框架,探究了不同网络结构对图像修复任务的影响,并与其他最先进方法进行了性能比较。关键词包括图像修复、深度学习、编解码器网络、网络结构和性能比较。
- 未来分割
提出了一种基于编码器 - 解码器网络的视频未来语义分割预测方法,使用先前的视频帧,仅利用 RGB 数据,利用知识蒸馏的训练框架预测未来场景的语义分割,并在 Cityscapes 和 Apolloscape 上取得了比基线和现有最先进方法更好 - 基于混合 LSTM 和编码器 - 解码器架构的图像伪造检测
本文提出了一种基于图像局部特征和深度学习的高置信度图像篡改检测和定位算法,通过利用重采样特征、长短期记忆单元和编码器 - 解码器网络实现了对篡改区域和非篡改区域的有效分割定位,提出的方法能够在像素级非常准确地定位图像篡改。
- 室内环境布局估计的边缘语义学习策略
本文提出了一种全新的基于编码 - 解码网络的室内场景分类方法,该方法可以充分利用室内场景的边缘和语义信息,实现 2D 室内场景的准确估计,其在基准数据集上取得了最佳表现。
- 非局部增强的编码器 - 解码器网络用于单张图像去雨
本文主要介绍了一种有效的端到端神经网络结构的实现方法,并提出了一种非局部增强的编码 - 解码网络框架,以更高效学习不断抽象的特征表示,同时极大地保留图像细节。新网络框架组成了一系列非局部增强的密集块,旨在充分利用所有卷积层的分层特征,以及捕 - UNet++:用于医学图像分割的嵌套 U-Net 架构
本研究提出了 UNet++ 架构,采用深度监督编码器 - 解码器网络和密集跳过层来实现医学图像分割,与 U-Net 和 Wide U-Net 架构相比,拥有更高的 IoU 增益。
- 利用对抗自编码器进行生成式概率新颖性检测
该论文基于深度学习编码 - 解码器网络架构,提出了一种概率方法来检测新数据点,并通过对正常数据分布的线性化及自编码网络的训练来实现。结果表明,在多个基准数据集上,该方法能够达到最先进水平。
- CVPR通过解耦 3D 人脸特征进行联合人脸重建和识别
本文提出了一种编码器 - 解码器网络架构,用于从单个 2D 图像中分离出形状特征,从而能够同时实现重建准确的 3D 人脸形状和学习面部识别的判别形状特征。与现有的 3D 人脸重建方法不同,我们的方法直接从单个 2D 图像回归密集的 3D 人 - 迭代深度卷积编码器 - 解码器网络的医学图像分割
本文提出了一种新的基于迭代深度学习框架的医学图像分割方法,使用迭代学习方法和编码器 - 解码器网络,结合卷积编码器和迭代学习,可以精确定位具有复杂形状或详细纹理的 ROI,实验结果表明该方法可以对各种医学图像进行良好的分割。
- 多视卷积网络通过简笔画实现三维形状重建
一种从 2D 线描图中重建三维形状的方法,采用深度编码器 - 解码器网络将线描图转换为点云,通过多视角深度图和法线图的融合优化得到点云,在维持拓补和形状结构的同时比容积网络具有更高的重建精度和输出表面分辨率。
- 用自上而下的全卷积编码器 - 解码器网络学习细化物体轮廓
本文提出了一种名为 TD-CEDN 的深度轮廓检测算法,该算法采用自上而下的完全卷积编码器 - 解码器网络,并在多尺度、多级特征学习以及前向传播阶段获得原始特征图,然后采用自下而上的方式进行解码,并使用各层次的特征进行迭代式的反卷积操作来实 - Quicksilver:一种快速的预测性图像配准深度学习方法
Quicksilver 是一种基于深度编码器 - 解码器网络的快速可变形图像配准方法,能够准确预测通过数值优化得到的配准结果,并具有出色的配准效果和预测精度,同时能够联合学习图像相似度度量和校准网络。
- ICCVRoomNet: 端到端的房间布局估计
该论文的研究重点为从单目 RGB 图像中估算房间布局,采用端到端可训练的编码 - 解码网络 RoomNet 直接估算有序的房间布局关键点,实现了与最新工作相比 200-600 倍的加速和最新的性能。