- RoadNet-RT: 实时道路分割的高通量 CNN 架构和 SoC 设计
本文提出了一种基于 CNN 网络的轻量级、高吞吐量的 RoadNet-RT 架构,通过深入优化硬件设计和使用分离深度卷积和非均匀核大小卷积等技术,显著提高了道路分割的实时处理速度。相较于现有最先进的网络,在仅仅 6.2% 的精度损失下,Ro - CVPRPipeNet: 多模人脸反欺诈选择性模态融合网络的流水线
我们提出了一个名为 “PipeNet” 的多流卷积神经网络架构,针对跨族群、多模态连续数据下提高面部反欺骗泛化能力的挑战,利用 CASIA-SURF 最新的 CeFA 数据集进行训练和测试,使用有选择的模态流和有限帧投票等方法,达到了 CV - 自主车辆中可解释的物体诱导动作决策
提出一种新的自动驾驶模式,基于场景理解、行动诱导对象和解释,采用多任务学习和 CNN 架构,可以优化车辆动作指令和场景解释的准确度,改善行动诱导对象的识别和车辆动作预测表现。
- 信号提取:多模态活动识别中的判别信号编码
该研究提出了一种支持多种传感器模态的简单、有效和灵活的动作识别方法,将多元信号序列编码成图像,并使用最近提出的 EfficientNet CNN 架构进行分类,实验结果表明该方法在多个数据集上的表现均优于目前的激光雷达数据集识别方法。
- 仅需一次观看:一种用于实时时空动作定位的统一 CNN 架构
本研究提出了一种 YOWO 统一的 CNN 结构,用于视频流中的实时时空动作定位,它是一个单阶段架构,具有提取同时预测时间和空间信息,并直接从视频剪辑中预测边界框和动作概率的特点。
- 可变形核网络用于联合图像滤波
该论文提出了 DKN 卷积神经网络架构及其高效实现,使用稀疏且空间可变的滤波核进行图像增强和降噪,并在深度图上采样,显著优于现有技术。
- 学习可普适的全尺度人员再识别表示
本文提出了使用人物重新识别 CNN 网络建模的新方法,使用 multi-scale 特征和统一聚合门,还使用 instance normalization 处理跨数据集的不一致性,并提出了一种有效的可微架构搜索算法。通过实验验证,该方法在同 - ICCVFuseMODNet: 基于摄像头和激光雷达的实时低光照强壮自动驾驶移动物体检测
本文提出了一种基于卷积神经网络(CNN)的方法,利用相机和 LiDAR 传感器的运动信息来检测移动物体,以应对低光条件下的自动驾驶车辆中的移动对象检测问题,并在 KITTI 数据集上进行了验证。
- PST900: RGB-Thermal 校准、数据集和分割网络
本文提出在语义分割中使用基于学习的技术并支持长波红外成像 (LWIR) 技术,解决了 RGB - 热成像相机校准和数据集问题并比较表明使用我们的方法可以获得最佳的结果。
- ICCVFisheyeMODNet: 自动驾驶周视摄像头上的移动物体检测
本研究提出一种卷积神经网络模型,用于使用自主驾驶环境中捕获的鱼眼图像进行运动物体检测,并设计了一个轻量级编码器来实现嵌入式部署。
- DFANet: 深度特征聚合实时语义分割
本文提出了一种名为 DFANet 的极其高效的卷积神经网络架构,用于在资源有限的情况下进行语义分割。通过子网络和子阶段级联聚合区分特征,通过多尺度特征传播,DFANet 大大减少了参数数量,并提高了模型学习能力,在速度和分割性能之间取得平衡 - CVPRGIF2Video:GIF 图像的颜色去量化和时间插值
本文提出了 GIF2Video 方法,这是第一个应用于 GIF 图像增强的基于学习的方法,利用 CNN 网络实现了颜色去量化和时间插值等方面的帧重建与修复,实验结果表明,该方法优于现有基线方法和先进技术,可以显著改善 GIF 动画的视觉质量 - Nesti-Net: 使用卷积神经网络进行非结构化三维点云的法向估计
本文提出了基于多尺度点统计(MuPS)的局部高斯网格表示的法向估计方法 Nesti-Net,使用混合专家(MoE)结构来优化每个点周围的最佳比例,从而显著提高模型的鲁棒性和精度。实验结果表明,该方法在合成数据集上达到了最先进水平,并在实际扫 - MM深度激光雷达卷积神经网络用于理解运动车辆的动态
本文提出了一种用于理解场景中运动车辆动态的新方法,该方法通过设计卷积神经网络 (CNN),并在训练期间引入一系列所谓的 “预文本任务”,以消除自我运动和外部车辆运动的混淆。我们在测试阶段使用 lidar 扫描的连续对来试验该系统,并在训练期 - ECCV本质图像和语义分割的联合学习
该研究提出了一种基于反射图像的半监督 CNN 自动学习模型,该模型同时处理语义分割和本征图分解任务,该模型可以提高自然场景下两种任务的准确性。
- ECCV人脸去欺骗:噪声建模反欺骗
本研究提出一种面部反欺诈方法,通过图像处理和 CNN 架构对虚假面部噪声进行建模,可以通过反向分解虚假面部得到虚假噪声和真实面部,以增强分类的准确性并可视化虚假噪声。
- 无监督深度多焦点图像融合
本文介绍了一种基于卷积神经网络的无监督端到端学习方法,可以直接从多焦点输入图像对中预测完全聚焦的输出图像,并利用图像结构相似性 (SSIM) 计算损失。实验结果表明,该方法在视觉质量和客观度量方面优于现有的最先进技术。
- 通过学习图形连通性进行深度血管分割
本研究提出了一种新颖的基于深度学习的血管分割系统,将图卷积网络与统一的 CNN 结构相结合,可以应用于扩展任何类型的基于 CNN 的血管分割方法,实验证明该方法在两个视网膜图像数据集以及冠状动脉 X 射线血管造影数据集上性能优于当前的最先进 - 基于隐变量 2.5D 热力图回归的手部姿态估计
本文提出一种使用 2.5D 姿势表示的新方法来从单目图像中估计 3D 手部姿态,通过使用深度图和热力图分布来训练卷积神经网络 (CNN) 模型,该模型在多个数据集上实现了最先进 2D 和 3D 手部姿态的估计。
- MM用全点卷积神经网络对自然图像的统计规律进行建模
本文提出了一种基于深度学习的 CNN 网络结构来模拟自然图像的统计规律,并使用随机重排像素的方式提高 CNN 对于像素分布的关注度,采用点卷积核取代大卷积核,实现了更好的统计表示能力。实验结果表明,该网络在颜色校正和图像去雾两个应用中达到了