SNE-RoadSegV2:提升异质特征融合和失败感知的自由空间检测技术
本文介绍了一种能够从深度图像中准确高效地推断表面法线信息的新型模块,以及一个能够同时提取并融合 RGB 图像和推理表面法线信息的数据融合卷积神经网络(CNN),并使用一个全新的数据集,该数据集包含在不同照明和天气条件下收集的大规模合成自由空间检测数据,证明了我们提出的算法能够在不同的数据集中取得最佳的性能表现。
Aug, 2020
本文介绍了一种基于 AF2-S3Net 的端到端编解码 CNN 网络,用于 3D LiDAR 语义分割,并在大规模 SemanticKITTI 基准测试上展示了其优越性能。
Feb, 2021
本文提出使用 Feature Fusion with Different Norms (FFDN),利用多重尺度的丰富全局上下文信息和垂直池化模块来减少在垂直方向上全局上下文编码的复杂度。在城市风景测试数据集上,平均交互并集(mIoU)为 73.1,每秒帧数(FPS)为 191,与目前最先进的结果相当。
Oct, 2022
本文提出了一种新的单次面部检测网络 DF $^2$ S $^2$,其引入了更有效的特征融合金字塔和在 ResNet-50 上更高效的分割支路来处理细节、遮挡和模糊等问题,并在更高级别的特征映射中应用语义信息作为上下文线索,以增强低级别特征映射,最大限度地利用检测监督信息并在自我监督的方式下,处理语义与细节之间的失衡,并在 WIDER FACE 数据集上取得了最先进的结果。
Nov, 2018
本文提出了一种新的鲁棒性编码器解码器结构的神经网络,使用少量的训练示例进行端到端的训练,通过特征融合在 Feature Pooling Module 中提取多尺度特征,实现对相机运动的鲁棒特征池化,免去多尺度输入的需求,通过 CDnet2014、SBI2015 和 UCSD Background Subtraction 数据集的实验表明,所提出的方法的整体 F-Measure 平均值优于现有所有最先进的方法。
Aug, 2018
本文提出了一种多路径编码器结构来提取多路径输入的特征,多路径注意力融合块模块来融合多路径特征,以及细化注意力融合块模块来融合高层抽象特征和低层空间特征。同时,提出了一种新的卷积神经网络架构,名为注意力融合网络 (AFNet)。基于该 AFNet,在 ISPRS Vaihingen 2D 数据集上达到了 91.7% 的整体精度和 90.96% 的平均 F1 分数,在 ISPRS Potsdam 2D 数据集上达到了 92.1% 的整体精度和 93.44% 的平均 F1 分数,取得了最先进的性能。
May, 2021
通过将动态稀疏特征融合机制与三维卷积中的限制深度移位相结合,提出了一种 3D 医学图像分割模型,名为 E2ENet。在多种资源限制条件下,E2ENet 相比之前的方法在精度和效率之间实现了较优的平衡,并在大规模挑战 AMOS-CT 上实现了与之前最佳方法相当的准确性,同时在推断阶段节省了 68%的参数计数和 29%的 FLOPs。
Dec, 2023
本文提出了一种紧凑型次级融合网络 (Compact Twice Fusion Network, CTFN),其中包括语义增强模块 (Semantic Enhancement Module, SEM) 和伪像素级加权模块 (Pseudo Pixel-level Weighting, PPW) 以完全整合多尺度特征,以及一种名为动态聚焦损失的新型损失函数,可用于处理纹理噪声干扰带来的分类挑战,在三个数据集上评估,CTFN 在参数和计算成本上均优于现有最先进方法。
Jul, 2023
本文提出了一种新颖的动态特征融合策略,通过权重学习器对不同输入图像和位置适应地推断各级特征的融合权重,以更好地考虑由 Feature Map 的不同位置和输入图像产生的贡献,从而实现更准确、更清晰的边缘预测,实验证明该方法在语义边缘检测方面表现优异,达到了新的最高水平。
Feb, 2019
利用自车与基础设施传感器数据的合作使用可以显著提高自主驾驶感知能力,为解决车辆 - 基础设施合作三维物体检测中的问题,我们提出了一种新的合作检测框架 Feature Flow Net (FFNet),它是一种基于流的特征融合框架,利用特征流预测模块预测未来特征并进行补偿,同时引入自监督训练方法使 FFNet 能够从原始基础设施序列中生成具备特征预测能力的特征流,在 DAIR-V2X 数据集上实验结果表明,我们的方法在只需 1/100 的原始数据传输成本且在一个模型中覆盖所有延迟的情况下,优于现有的合作检测方法。
Nov, 2023