- CVPR池化再思考:您的感受野还不够优化
本文提出了一种优化神经网络中感受野尺寸和形状的简单而有效的动态最优池化 (DynOPool) 方法,并通过在多个数据集上的实验验证了该方法在图像分类和语义分割中的有效性。
- CVPRMixFormer: 跨窗口与跨维度混合特征
本论文提出了一种名为 MixFormer 的方法,将局部窗口自注意力与深度可分卷积相结合,跨窗口连接建模以扩大感受野,并在通道和空间维度上提供互补线索,从而实现更好的特征混合。在图像分类方面,MixFormer 相比于 RegNet 和 S - FFC-SE: 语音增强的快速傅里叶卷积
本文设计了以 Fast Fourier convolution 为核心的神经网络结构,用于语音增强,实验证实大的接受域使其优于普通卷积模型,并展示结果强于或与其他语音增强基线相当。
- CVPR具有可变形注意力的视觉 Transformer
本文介绍了一种新颖的变形注意力模块,提出了 Deformable Attention Transformer,通过变形注意力实现了基于图像分类和密集预测任务的骨干模型,并在广泛的基准测试中取得了显著的改进。
- ACDNet:自适应组合扩张卷积用于单目全景深度估计
本文提出了一种基于自适应膨胀卷积的 ACDNet,用于预测单目全景图像的密集深度图,实验结果表明 ACDNet 明显优于当前最先进的技术。
- 用傅里叶卷积实现稳健的高分辨率大面罩修复
提出了一种基于快速傅里叶卷积(FFC)的图像修复网络结构的新方法 —— 大掩模修复(LaMa),该方法使用高接受场感知损失和大型训练掩模使网络具有更大的接受场,通过在各项数据集上的实验得到了优越的性能。
- 使用深度卷积神经网络进行音频分类和标记的接收域正则化技术
本文研究了不同音频任务中已知卷积神经网络架构的变体性能。结果表明,调整卷积神经网络的感受野对其广义性至关重要。通过跨越多个音频分类和标记任务进行系统测试,我们提出了几种系统方法来控制 CNN 的 RF,并表明使用我们提出的方法对 CNN 的 - ECCV主动学习的语境多样性
通过引入上下文多样性的概念,利用所提出的上下文多样性度量在两个主动学习框架中使用,以进行主动帧选择,并在语义分割,目标检测和图像分类的基准数据集上建立最先进的结果。
- 基于标签一致性的图神经网络用于半监督节点分类
本文提出了基于标签一致性的图神经网络(LC-GNN),扩大了 GNN 中的节点感受野,利用未连接但标签相同的节点对。在基准数据集上的实验证明,LC-GNN 在图形半监督节点分类方面优于传统的 GNN,在只有少数标记节点的稀疏场景中也表现出优 - 可变形空间传播网络用于深度完成
本文提出了一种可变形空间传播网络,用于适应性地为每个像素生成不同的感受野和密合矩阵,从而更准确地从稀疏深度测量中恢复密集的深度地图,KITTI 深度完成基准实验结果表明我们提出的方法达到了最先进的性能。
- 有向图卷积网络
本研究提出了一种名为 DGCN 的新型 GCN 模型,通过利用一阶和二阶接近度来将其扩展到有向图,可以保留有向图的连接属性并扩展卷积操作的感受野,实验证明只用 DGCNs 可编码更多有用的图信息并在推广到其他模型时提高性能。
- ICLROmni-Scale CNNs: 一种简单而有效的时间序列分类卷积核大小配置方法
本文提出了一种基于 Omni-Scale Block 的 1D-CNN 模型,可以通过包含多个质数的一组核大小有效地覆盖不同数据集中的最佳 Receptive Field 大小,并达到了四个时间序列基准测试的最先进性能。
- 深度卷积神经网络中感受野作为正则化器的应用 --- 声学场景分类
本文研究了卷积神经网络在音频处理任务中的表现。通过对 Receptive Field 的分析,发现 RF 对模型的泛化能力很重要。通过系统地调整 CNNs 中的 RF,可以让深层模型表现得更好。
- RF-Net:基于感受野的端到端图像匹配网络
本文提出一种新的端到端可训练的匹配网络 RF-Net,基于感受野计算图像之间的稀疏对应关系。通过引入感受野来构建特征图,增强关键点检测效果,同时加入邻居掩码来提高描述符训练的稳定性。我们在公开数据集 HPatches 上训练并与其他方法进行 - LFFD:一款适用于边缘设备的轻量快速人脸检测器
本文提出了一种针对边缘设备的轻量级和高速人脸检测器,其方法是基于无锚点的一阶段检测,通过重新考虑感受野和有效感受野(ERF)之间的关系来实现多尺度的连续人脸检测。综合实验结果表明,该方法在多个数据集上取得了更高的准确度和更快的推断速度。
- CVPR为实时道路图像语义分割辩护:基于预训练 ImageNet 架构
本文提出了一种基于 light-weight general purpose architecture、light-weight upsampling 以及融合多重分辨率的特征来扩大接受域的语义分割方法,在多个数据集上获得显着的优越性能和较 - 适应性场景发现用于人群计数
本文提出了一种适应性场景发现框架用于人群计数,该系统包括两个平行通道和一个自适应重校准分支,能够代表高度变化的人群图像并在两个具有挑战性的基准测试中实现了最先进的结果。
- ECCVBiSeNet: 双边分割网络用于实时语义分割
本文提出了一种名为 Bilateral Segmentation Network(BiSeNet)的新型网络结构,通过引入 Spatial Path、Context Path 以及 Feature Fusion Module 三个模块,实现 - ECCV递归挤压 - 激励上下文聚合网络用于单图像去雨
本研究提出了一种基于深度卷积和循环神经网络的新型深度网络架构,用于单幅图像去雨。实验表明,在多个评估指标下,该方法优于现有的技术。
- DMCNN: 双域多尺度卷积神经网络用于压缩伪影去除
本文提出一个 Dual-domain Multi-scale CNN (DMCNN) 用于降噪 JPEG 格式图像,在此基础下扩充了网络的感受野,通过像素和 DCT 域的冗余性进一步提高了输出图像的质量,并在实验中取得了新的技术优势。