- CENet:面向自动驾驶的简洁高效激光雷达语义分割
本文介绍了一种名为 CENet 的图像语义分割网络,采用卷积而非 MLP,精选的激活函数和多个辅助分割头来提高特征描述能力和降低计算时间复杂度,使用公开的基准测试 SemanticKITTI 和 SemanticPOSS 进行的实验表明,与 - HiKonv:通过新的按位管理和计算最大化量化卷积的吞吐量
提出了 HiKonv,一种针对特定底层处理单元和低位宽量化数据输入最大化卷积吞吐量的统一解决方案,使用全位宽乘积器建立理论框架和性能模型,可在 CPU 和 FPGA 上实现卓越表现。
- ECCV对抗智能意识强鲁棒性目标检测器
本文介绍了一种基于对抗神经网络(Adversarial Neural Network)的 Robust Detector,采用了 Adversarial Image Discriminator 和 Consistent Features w - ECCVUniNet:卷积、Transformer 和 MLP 统一结构搜索
通过引入可学习的卷积、Transformer 和 MLP 操作符的混合结构,并利用上下文感知降采样模块进行特征适应,本文使用强化学习搜索算法在统一搜索空间中进行搜索,达到了在 ImageNet 数据集上取得更高精度和更高效率的目标,相对于 - CVPRShuffleMixer:一种高效的图像超分辨率卷积神经网络
本研究提出了一种轻量级的图像超分辨率算法 ShuffleMixer,其采用大型卷积和通道分割 - 混洗操作,与以前的模型不同,ShuffleMixer 采用大卷积卷积神经网络和用于 mobile-friendly 设计的 Fused-MBC - 数据扩增:对卷积神经网络效果的深入探讨
本文旨在评估不同数据集上的数据增强技术对于不同神经网络的性能影响,显示出一种把数据增强技术和深度学习模型架构相结合的方法可提高深度学习任务的性能。
- CVPR考虑遮挡的光场深度估计成本构造器
本研究提出了一个简单且高效构造光场深度估计匹配成本的方法,通过一系列具有特定设计膨胀率的卷积构成成本构造器,能够在不使用任何移位操作的情况下,将预定义视差下的像素进行整合匹配并处理遮挡情况,所提方法在光场深度估计的深度网络建模中取得了较好的 - 从不同的候选者学习,在张量核上优化降低精度卷积程序
这篇论文提出了一种基于 Tensor Core 和 MMA 指令的卷积操作优化方法,该方法通过自动调度探索线程块和 warp 尺寸的搜索空间,包括寄存器级 Packing 和布局优化等选项,使用学习算法找到最佳调度,从而比现有技术在 Ten - 一种采用新型通道增益和压缩的 CNN 的物联网恶意软件检测架构
该研究提出了一种利用卷积神经网络进行物联网恶意软件检测的架构,并通过多种卷积操作和特征提取方法,取得较高的检测精度和安全性。
- CVPR自注意力和卷积的融合
本文指出卷积和自注意力之间存在强烈的联系,两个模型的第一阶段都包含了相似的运算,本文提出了 ACmix 模型将它们混合使用从而最小化计算成本,实验结果表明,该模型在图像识别和 Downstream 任务上均取得了显著的改进。
- 我们为新的范式转变做好准备了吗?对视觉 Deep MLP 的调查
本文综述了深度 MLP 模型在计算机视觉领域中的应用,从卷积、自注意力机制以及 Token-mixing MLP 的内在联系和区别进行了详细比较,分析了 MLP 变种的优缺点和应用,并提出了下一代计算设备和方法的发展方向。
- 关系自注意力:视频理解中注意力缺少的部分
本文提出了一种基于动态生成关系卷积核和聚合关系背景的关系特征变换 —— 关系自注意力 (RSA),用于视频理解。通过实验和消融研究,证明 RSA 网络在视频动作识别等领域明显优于传统卷积和自注意力网络。
- ICCV点云分析的自适应图卷积
本文提出了 Adaptive Graph Convolution (AdaptConv) 来生成自适应的核,以动态地学习点云的特征,从而以灵活、精确地捕捉不同语义部分点之间的多样关系的方式,改善了基于点云的卷积操作的适应能力,并且在几个基准 - MM利用 Shadow Transformer 进行多视角检测(及视角一致的数据增强)
本文介绍了一种新型的多视图检测器,MVDeTr,并使用新的视觉一致性的数据增强方法,以及采用阴影变换技术来聚合多视图信息,提取目标特征,超过了现有最佳方法,能更准确地进行多视图检测。
- ICCV利用学习的相位到空间变换加速大气湍流模拟
本文提出了一种基于 phase-to-space transform 的新模拟方法,该模拟方法通过不变卷积和基函数学习,结合轻量化网络直接将相位转化为空间形式,以实现有效的大气湍流成像模拟,相对主流分裂步进模拟器,该模拟器可获得 300 倍 - ACLLV-BERT:利用层面多样性的 BERT 模型
该研究改进预训练模型,采用多种不同类型和顺序的神经网络层,采用进化算法寻找最优结构,在多个任务中优于现有的 BERT 模型。
- S$^2$-MLP: 视觉任务空间平移 MLP 架构
本文提出一种新颖的 MLP 架构,空间平移 MLP (S$^2$-MLP),只包含通道混合 MLP,利用局部接收场进行补丁之间的通信,其参数自由且计算效率高,比 MLP-Mixer 在 ImageNet-1K 数据集上获得更高的识别精度,同 - 双侧稀疏张量核
本文提出了一种新颖的架构来有效地利用权重和激活的稀疏性,通过外积计算原语和位图编码格式将二者结合起来。通过针对现有常见计算模式(矩阵乘法和卷积)的矩阵乘法和卷积算法的协同设计,提出一组新的 ISA 扩展,实现了这种设计,抓住现今深度神经网络 - CVPR解耦动态滤波网络
提出了一种 Decoupled Dynamic Filter(DDF)卷积方法,可以同时解决标准卷积的两个主要缺点:内容不适配和计算量大。DDF 将深度动态滤波器分解为空间动态滤波器和通道动态滤波器,大大减少了参数数量,并将计算成本限制在与 - CVPRInvolution:卷积内在性的翻转用于视觉识别
本文提出一种新的深度神经网络操作 Atomic Involution,其将传统卷积的空间不可知和通道特异性原则进行了倒置,可作为构建新一代神经网络的基础砖块并提高了卷积基线的性能。