- 海冰预测的独角兽:基于卷积神经常微分方程的 U-Net
通过引入一种名为 Unicorn 的新型深度架构,该论文旨在使用神经网络预测北极的每周海冰浓度,并通过对 1998 年至 2021 年的真实数据进行实证分析,证明了该模型在海冰浓度和范围预测任务中相较于其他模型具有显著的改进。
- DP-Net:学习图像识别的区别性部分
该论文介绍了一种具有较强解释能力的深度架构,名为 Discriminative Part Network (DP-Net),它利用了预训练的卷积神经网络 (CNN) 和基于部分的识别模块。该系统学习并检测图像中在不同类别中具有区别性的部分, - 概率部分多标签学习
这篇论文介绍了一种新颖的概率方法,名为 Partial Multi-label Learning(部分多标签学习),在这种方法中,每个训练实例对应一组候选标签,其中只有一部分是正确的;与现有方法相比,它不需要次优的消岐,因此可以应用于任何深 - 基于点集和中心偏移的单阶段多人解析
该研究提出了一种高性能的单阶段多人解析深度架构,在 MHPv2.0 数据集上实现了最佳的有效性和效率,超过了最先进的方法 2.1%的 AP50p,1.0%的 APvolp 和 1.2%的 PCP50。
- ECCVSPE-Net: 通过提高旋转鲁棒性增强点云分析
本文提出了一种针对三维点云的新型深度架构,称为 SPE-Net,使用内嵌 “选择性位置编码(SPE)” 程序,依靠注意机制有效地关注输入的旋转条件,从而提高优化的性能和鲁棒性,并且相对于 SOTA 方法在旋转和非旋转的数据上都显示出明显的改 - 在视频中扩展组合式注意力网络以进行社交推理
本论文提出了一种新的基于深度学习架构的社交互动推理方法,该方法利用了多步推理能力和注意力机制,并应用于多模式扩展。实验结果表明该方法可以更好地利用多模态输入并在 Social Video 问答任务中取得了 2.5% 的准确率提升。
- ProPaLL:概率性部分标签学习
本文介绍了 ProPaLL,一种新的概率方法,用于解决局部标签学习问题,相比现有方法具有简化训练过程、提高性能和适用于任何深层架构的优点。在人造和真实数据集上的实验证明,ProPaLL 比现有方法表现更好。
- CVPR引导式超分辨率图像增强的图正则化学习
本文提出了基于可微分的优化层和学习的亲和力图形成的新型超分辨率方法,该方法与先前的引导超分辨率深层架构不同,采用源图像作为约束而非仅仅是输入预测。实验表明,该方法在多个数据集上具有很好的效果。
- CVPRGlideNet:用于多类属性预测的全局、本地和内在基础密集嵌入网络
本文提出了一种新的深度神经网络结构 GlideNet,用于计算机视觉中的多类别属性预测,并在两个大规模数据集上获得了优于现有技术的结果。
- RAFT-Stereo:用于立体匹配的多层循环场变换
我们介绍了一种新的基于光流网络 RAFT 的校正立体的深度架构 RAFT-Stereo。我们引入了多级卷积 GRU,更有效地传播图像间的信息。RAFT-Stereo 的修改版本可进行准确的实时推断,其在 Middlebury 榜单上排名第一 - RCDNet:用于单张图像去雨的可解释性降雨卷积字典网络
本文介绍一种基于 Rain Convolutional Dictionary Network 的单图像去雨方法,通过设计一种迭代算法,将其抽象成一种可解释的深度神经网络,从而在推理过程中提高去雨性能,特别适用于不同类型雨水的不一致情况。
- 无监督深度域自适应中的潜在域推断
本文提出了一种新的深度学习架构,通过自动发现视觉数据中的潜在域并利用这些信息来学习强健的目标分类器来解决不带标签数据的目标域学习问题,在公共基准测试中表现优于现有的方法。
- 单目三维目标检测中伪 LiDAR 方法的可信度是否被低估了?
本研究揭示出 Pseudo-LiDAR 方法训练出的验证结果存在显著偏差,首次提出了 3D 置信度预测模块,利用该模块可以成功地与 RGB 3D 检测方法相结合,并证明新设计的 3D 置信度测量方法可以获得最先进性能。
- RAFT-3D: 使用刚体运动嵌入实现场景流
本文提出了一种基于 RAFT 模型的新型深度 architecture,名为 RAFT-3D,其中包含刚性运动嵌入和 Dense-SE3 可区分层,以提高场景流的像素级三维运动估计性能,并在 FlyingThings3D 和 KITTI 数 - CVPR学习形状手柄的生成模型
该研究提出了一种生成模型来合成 3D 形状,以句柄集的形式 —— 轻量级代理,为交互式编辑、形状解析和构建紧凑的 3D 表示提供应用,通过监督自动形状概括技术,展示了直观的形状表示,并通过我们的模型学习的潜在空间来指导交互形状编辑,补充和插 - ECCV从视频中学习对象的永恒性
通过数据学习目标物体的位置推测,需要拆分成四个子任务,其中第四个子任务最具挑战性,因为它需要一个系统来推理不可见物体的移动位置,本文介绍了一个统一的深度架构,可以在四种情况下学习预测物体位置,并在基于 CATER 的新数据集上对其进行评估, - MM语音情感识别的可迁移特征学习
本文提出了一种基于卷积神经网络和长短记忆网络的深度学习架构,通过使用可转移的特征从多个源域自适应模型并识别不同情感领域的语音情感,实验结果表明,该方法提供了 4.3%至 18.4%的效果增益。
- AAAIRDSNet:一种新的深度架构,用于互逆物体检测和实例分割
本篇论文提出了一种新的两流式结构深度架构 RDSNet,通过引入物体级别和像素级别学习特征,在目标检测和实例分割之间实现双向性,以获取更高精度的分割结果和更准确的边界框。
- 深度 K-SVD 去噪
通过重新设计算法以监督学习的方式操作,本文针对 K-SVD 图像去噪算法提出了一种基于深度学习的端到端架构,并在优化去噪方面进行了训练,以克服将 K-SVD 方案变为可微分的机器并学习的困难。结果表明,该算法在保留原始 K-SVD 精髓的同 - ACL将统计假设检验整合进深度神经网络
该研究报告介绍了一种新的深度架构,结合统计检验过程共同训练文本及其标签描述,以用于多标签和多类别分类任务,该方法完全基于数据驱动,适用于提供适当的训练数据的不同分类问题,我们在多个公开数据集上进行了测试,其中某个数据集的表现大幅提高,其它数