- ECCVDOPE: 野外全身三维姿态估计中的零件专家蒸馏
DOPE 是第一种能够在复杂场景中检测和估计整体身体、手和面部 3D 姿势的方法,它利用独立的专家和蒸馏过程来训练整体姿势检测的单个深度神经网络,并在保持接近专家效果的同时实现了比大师集合更快的实时处理速度。
- ECCV针对视觉目标跟踪器的目标条件分割方法探究
本文通过研究计算机视觉领域中的目标条件分割方法,将边框跟踪器转化为分割跟踪器,从而实现了与最近提出的分割跟踪器竞争并具有准实时表现。
- ECCV隐私保护的视觉 SLAM
该研究提出了一种隐私保护的 Visual SLAM 框架,它可以在实时环境下使用混合线条和点云来估计相机姿态和执行束调整,并采用线云图进行优化,以实现预期的隐私保护和实时性能。
- LIO-SAM: 利用平滑和映射实现紧耦合的激光惯性里程计
该研究提出了一种通过平滑和制图实现高精度、实时移动机器人轨迹估计和地图构建的紧密耦合激光雷达惯性测程联合优化的框架方法,其中采用了因子图算法来融合不同来源的相对和绝对测量数据,并使用 IMU 预积分解除激光雷达测程偏差。
- 使用手持设备在野外实时进行单张图像深度感知
探究采用适当的网络设计和训练策略以及如何将结果网络映射到手持设备以实现实时性能的方式解决单张图像深度估计的低可靠性和需求高计算资源的问题,并通过实验证明这些快速网络具有良好的泛化能力以用于现实应用,包括野外中的实时深度感知增强现实和图像模糊 - 海绵示例:神经网络的能量延迟攻击
本文介绍了一种利用对抗攻击对神经网络进行针对能源和决策延迟的攻击,该攻击构造出能够最大化能源消耗和延迟决策的输入,可对成熟的视觉和语言模型进行攻击,并探讨了从平均情况到最坏情况的硬件能源消耗分析的防御策略。
- CVPR超高分辨率图像修复的上下文残差聚合
提出了一种上下文残差聚合 (CRA) 机制来产生高频残差,从而实现对低分辨率预测的重量级聚合。该模型在小图片上进行训练,可在高分辨率图片上进行推断,其能力可达到以前的学习基础方法所无法实现的程度。
- 实时通用光真实风格迁移的联合双边学习
基于深度神经网络的较慢的最新方法限制实际分辨率,或仍包含可感知的瑕疵,我们在这里提出了一种新的端到端模型,用于光影逼真的风格转移,其快速且产生逼真的结果,与现有最先进的方法相比,我们的方法产生了视觉上更好的结果,速度提高了三个数量级,并在移 - 使用监督式机器学习方法合成控制屏障函数
该论文描述了一种从传感器数据中估计控制屏障函数的学习框架,经实验证明可以在未知状态空间区域中实现机器人系统的安全操作。
- 使用单线程进行快速显著目标检测的深度非局部模块
本文提出了一种新的深度学习算法,能够同时实现竞争性准确性和高推理效率,通过深度可分离非局部模块(DNL)和 DNL 网络架构,隐式建模对比以收获通道内和通道间的相关性。该算法成功地在单个 CPU 线程上实现现实时间性能,成为现有所有基于深度 - ECCV学习关注焦点以实现高效视频目标检测
提出了一种基于可学习的空间 - 时间采样 (LSTS) 模块、分散递归特征更新 (SRFU) 和密集特征聚合 (DFA) 模块,实现了视频目标检测中的准确空间对应关系,增强特征更新,提升检测性能,并在 ImageNet VID 数据集上取得 - ICCV单网络全身姿态估计
本研究提出了一种新的单一神经网络方法,用于 2D 全身姿势估计,并可同时定位身体、面部、手和足关键点。该方法采用一种底部上的公式,使其在图像中的人数不论多少,都能保持恒定的实时性能。神经网络采用多任务学习,经过改进的结构可以处理身体 / 脚 - 高阶排名和链接预测:从闭合三角形到闭合高阶模式
我们引入了模式闭合的概念,并基于闭合高阶网络模式的概念描述了基于高阶排名和链接预测方法。这些方法对于基于实时排名和链接预测的应用,如网络搜索,在线广告和推荐,具有快速高效的特点。
- AAAIGestARLite:一种基于指向手指的智能手机和视频透视耳机的设备内手势界面
我们提出了一种用于便携式可穿戴设备的新型轻量级手势识别框架,该框架由一系列最先进的深度学习模型驱动,能以实时性灵敏地识别手势,实现了 80%的分类准确度和仅 0.12 秒的平均延迟。
- ICCV资源高效的三维卷积神经网络
本文研究了如何将现有的资源有效的 2D 卷积神经网络转换为 3D 卷积神经网络,并测试了它们在不同复杂度水平下的性能和实时性能,结果表明这些模型可以应用于各种实际应用程序,提供了可观的准确性和内存使用。
- 构建稳健的航拍摄影平台:在非结构化环境中定位和跟踪移动目标
本文介绍了使用视觉算法进行目标定位、实时增量式 3D 签名距离地图算法进行遮挡和安全计算、实时相机运动规划器进行优化平滑度、碰撞、遮挡和艺术指导的航拍摄影完整系统,旨在克服多个专业领域影响安全控制无人机的局限,并验证该系统在追踪动态目标方面 - 无需登记的人脸 SSD:野外微笑、面部属性和情感的单次拍摄分析
本文提出了一种名为 Face-SSD 的新颖单次快照人脸相关任务分析方法,使用完全卷积神经网络检测各种规模的多个面孔,并识别 / 回归一个或多个面部相关类别。Face-SSD 是第一个不依赖于预处理(如提前脸部检测和配准)即可执行人脸分析的 - SiamVGG:使用深度孪生网络进行视觉跟踪
本篇研究提出了一种能够追踪物体的算法 SiamVGG,通过结合使用 Deep Neural Network 和 Convolutional Neural Network 技术以及 Cross-correlation 算子,可以在保证较高跟踪 - 自动驾驶的实时联合目标检测和语义分割网络
本论文提出了一种联合多任务网络设计,用于同时学习目标检测和语义分割,以实现低功耗嵌入式 SOC 上的实时性能,并在两个公共数据集(KITTI,Cityscapes)和私人鱼眼相机数据集中评估提出的网络。
- EventNet:异步递归事件处理
本研究提出了 EventNet,一种基于新型视觉传感器的神经网络,旨在实时处理异步事件流,并采用了新的时间编码方案来建模输出对数万个因果事件的依赖关系,同时在标准 CPU 上每秒处理百万个事件,通过实验验证了该框架的实时性和稳健性。