- 3D Shuffle-Mixer: 一种用于医疗体积稠密预测的 Transformer-MLP 范式的高效上下文感知视觉学习器
研究提出了一种新的 3D Shuffle-Mixer 网络,它采用本地视觉变换器 - MLP 范例,可以更有效地应用于医学成像中的密集预测,获得比其他先进的密集预测方法更好的性能。
- ECCV密集连体网络用于密集无监督学习
本论文提出了 Dense Siamese Network(DenseSiam),这是一种针对密集预测任务的简单的无监督学习框架,通过最大化图像两个视图之间的相似性(包括像素和区域一致性),学习视觉特征表示,并证明了其在图像分类和语义分割任务 - CVPR具有可变形注意力的视觉 Transformer
本文介绍了一种新颖的变形注意力模块,提出了 Deformable Attention Transformer,通过变形注意力实现了基于图像分类和密集预测任务的骨干模型,并在广泛的基准测试中取得了显著的改进。
- CVPRDenseCLIP: 基于语言引导的密集预测和上下文感知提示
本文提出了一种框架,通过使用 CLIP 的预训练知识的隐式和显式方法来进行密集预测,是一种模型不可知的方法,可应用于任意密集预测系统和各种预训练视觉 Backbones,包括 CLIP 模型和 ImageNet 预训练模型,实证实验表明,我 - CVPR从部分注释的数据中学习多个密集预测任务
本研究提出了一种标签高效的方法,针对部分注释的数据(即每个图像不都有所有任务标签),在多个密集预测任务上联合学习,通过保留输入图像的高级信息,并成功利用任务关系对多任务学习进行监督学习的多任务训练程序。我们严格证明了我们的方法可以有效地利用 - Twins: 重访视觉 Transformer 中空间注意力设计
本文针对密集预测任务,重新设计了空间注意力机制,提出了 Twins-PCPVT 和 Twins-SVT 两种高效且易于实现的视觉转换器架构,并在图像分类、密集检测及分割等视觉任务上取得了出色的性能表现。
- 稠密点预测:一种适用于人群计数和定位的简单基线
本文提出了一个名为 SCALNet 的简单而有效的人群计数和定位网络,它将计数和定位任务视为像素密集预测问题,并将它们整合到一个端到端的框架中,在 NWPU-Crowd 基准测试中获得了超过 5%和 10%的改进。
- ICLR具有置信度适应性的任意时刻稠密预测
我们提出了 ADP-C,这是一种任意时刻密集预测方法,通过在模型中添加 “退出” 级联以进行多个预测,并结合空间自适应方法来避免在早期预测已经足够自信的区域进行进一步计算,可实现任意推理而不牺牲准确性,并同时减少基准模型的总浮点运算次数。
- 基于训练嘈杂负图片的密集异常检测和开放式识别
本文提出了一种基于密集预测的异常检测方法,利用广泛而多元的通用数据集作为负样本,通过在内部训练图像上叠加负补丁来鼓励模型识别已知和未知之间的边界。在三个密集开放识别基准数据集上得到了有竞争力的实验结果。
- CVPR用于密集预测任务的密集连接多扩张卷积网络
本文介绍了一种新的用于高分辨率密集预测的卷积神经网络架构,称为 D3Net,其采用了多分辨率学习和逐渐膨胀的感受野来同时建模局部和全局模式,避免了深度网络中的深度耗散问题,并在图像和音频处理任务中取得了优越的性能。
- ECCVAxial-DeepLab: 独立的轴向注意力在全景分割中的应用
本论文提出两个一维自注意力层的 2D 因式分解来减少计算复杂度,同时提出了一个位置敏感型自注意力设计,该设计结合两个一维自注意力层形成了一种新的构建块,称为位置敏感型轴注意力层;在图像分类和密集预测任务中,实验证明本文所提出的模型在四个大规 - ConvPoseCNN: 密集卷积 6D 物体姿态估计
该研究介绍了 ConvPoseCNN,它是一种全卷积架构,能够实现对象位姿的像素级密集预测,包括翻译和方向组件,其中密集方向以四元数形式表示,并使用不同方法对密集方向预测进行聚合,该方法与比较方法相比具有更少的参数和更快的训练速度,而且能够 - ECCVSOLO: 基于位置的物体分割
提出了一种新的、非常简单的实例分割方法,通过引入 “实例类别” 概念,将实例掩码分割转化为可分类问题。实验结果表明,该方法具有较强的性能和简单的框架,可以作为许多实例级别识别任务的基准。
- CVPR稠密预测的结构化知识蒸馏
该论文研究了如何将大型神经网络中的结构信息转移到紧凑型神经网络中,以用于计算机视觉中的密集预测任务,提出了从大型神经网络到紧凑型神经网络的结构蒸馏算法,并通过三个密集预测任务的实验展示了方法的有效性。
- 利用基于块运动的特征插值进行视频快速语义分割
本文提出了一种新的加速视频推理的方法 —— 使用基于块运动向量和特征传播技术实现的快速特征传播技术以及基于周围帧传播得到的特征的特征插值技术,能够在保持精度的前提下,将图像分割的速度从单帧基线的 30ms 提高到每秒 20 帧,实现了几乎 - 密集变换网络
本研究提出了密集变换网络的构建方法,设计了不同于之前需要输入图像分割大小的神经网络结构,通过对使用高分辨率像素预测的自适应分割进行了验证,证明该方法在图像分割任务中取得了更好的表现。
- NIPS等价映射的密集 CNN 学习
该论文提出了一种新型的等效卷积和等效池化层,可以在密集预测的同时保持与基线 CNN 模型的等效性,并实现了参数的转移学习,在各种任务中均取得了比基线 CNN 模型更高的准确性。
- ICLR空洞卷积多尺度上下文聚合
本文提出了一种特别为密集预测设计的新的卷积网络模块,该模块利用扩张卷积系统地汇集多尺度上下文信息,而不会丢失分辨率,并证明了该模块可以提高现有最先进的语义分割系统的精度。同时,作者还探究了将图像分类网络适应于密集预测的可能性,并提出了简化适