- ICLR基于部件的模型提高对抗鲁棒性
本文介绍结合人类先验知识和端到端学习以提高深度神经网络的鲁棒性,并引入了一种面向目标分类的基于部件的模型,相较于基准模型 ResNet-50,我们的基于部件的模型在三种数据集上实验表明都具有更高的准确性和更高的适应性。
- ECCV多视角匹配的高效表征学习
本研究提出了一种将自监督学习和多视角匹配技术相结合的方法,在没有额外标签的情况下,利用来自嵌入式相机的机器人吸尘器捕获的数据学习更高质量的表示,并证明了其在物体分类性能上的有效性。
- ECCVPointTree:具有松弛 k-d 树的鲁棒变换点云编码器
PointTree 是一个基于松弛 K-D 树,采用主成分分析作为分割规则的点云通用编码器,通过前向预对准进一步提高其鲁棒性,结合点描述符和点最大化操作达到优足以处理变形的点云数据的目标,在各种基准数据集上,其表现优于现有最先进方法。
- ECCV形状、质感和颜色在视觉识别中的贡献
本文研究了人类视觉系统(HVS)的三个重要特征(形状,纹理和颜色)对物体分类的贡献,构建了一个人形视觉引擎(HVE),分别从图像中计算形状,纹理和颜色特征,然后将特征向量连接以支持最终分类,并利用 HVE 总结和排序三个特性对目标识别的贡献 - 估算异构设备在执行 AI 推理时的功耗消耗
本文研究了物联网在物体识别任务中的能量消耗以及 NVIDIA Jetson Nano 板子的实际表现,最终通过对 YOLOv5 模型进行性能测试,发现 YOLOv5n 在低功耗消耗下实现了更高的帧率(12.34fps),达到了更为优秀的表现 - CVPR终身流浪:一种逼真的少样本在线持续学习环境
本文探讨了在线小样本学习在多个室内环境中物体分类的应用。研究发现,存在着灾难性遗忘和在线性能之间的平衡问题,提出了未来改进的方向。
- 设计对称神经网络处理三维点云
该研究旨在通过引入群等变性,提高当前用于 3D 点云的神经网络的泛化和鲁棒性。在实验中,该方法表现出比其他群等变模型更优越的性能,且具有较低的复杂度和 GPU 内存占用,提升了诸如物体分类和语义分割等任务的性能。
- CVPRAEGNN: 异步事件驱动的图神经网络
本文提出采用异步事件驱动图神经网络 (AEGNN),将事件处理范式从已知稀疏的静态图扩展到事件数据域中的一个演化的稀疏图,在物体分类和检测任务上,实现了计算复杂度提高 11 倍的同时,保持了最新的异步方法相同甚至更好的性能表现,将计算的降低 - CVPRCrossPoint: 自监督的跨模态对比学习,用于三维点云理解
本研究提出了一种名为 CrossPoint 的简单跨模态对比学习方法,通过自监督学习,在不需要人类标注的情况下,实现可转移的三维点云表示,通过最大化点云和相应渲染的二维图像之间的协议,实现了三维物体分类和分割等多项任务,并验证了我们的方法在 - CarSNN:一种基于 Loihi 神经形态研究处理器的事件驱动自主车辆的高效脉冲神经网络
本文介绍了使用 SNN 和 DVS 结合的方式来实现基于事件的汽车分类器从而应用于自动驾驶,最终在 Intel Loihi 神经形态硬件上实现,并取得了最高 86% 的识别率和 310 mW 的低功耗。
- 多个噪声部分标注者中学习
本文提出了一种基于概率生成模型的能够估计多个噪声偏差的部分标注工具并扩展了程序化弱监督的基础,通过对 3 个文本分类和 6 个对象分类任务的评估,证明了部分标注的效果可达到 8.6% 的平均准确率提高,进而探讨了部分标注在零样本对象分类任务 - IJCAISiamRCR:针对视觉目标跟踪的互惠分类和回归
本文提出了一种名为 SiamRCR 的新型同孪网络追踪算法,建立了分类和回归分支之间的相互关联,通过添加定位分支来解决分类和回归不准确之间的问题,证明其在多个实验结果上具有优越性。
- CVPRMetaAlign: 无监督领域自适应中的领域对齐和分类协调
本文介绍了一个基于元学习的有效优化策略 MetaAlign,以协调域对齐任务和分类任务的目标函数的不一致性,实现在元训练和元测试中同时优化域对齐和分类任务的最大化,从而提高了无监督领域自适应问题的性能。
- 具有多个等变对齐的旋转不变点卷积
研究了 3D 点卷积中平移不变性和等变性的关系,并使用旋转等变对齐改进了卷积网络,实现了物体分类和语义分割方面的表现提升,减少平移不变和标准 3D 深度学习方法之间的差距。
- ICCV通过遮挡完成的无监督点云预训练
通过遮挡数据重建来对点云进行预训练处理,证明该方法能显著提升不同数据集和编码器的下游任务精度,特别是在对象分类和分割方面比以往预训练方法表现更优。
- CVPRPhraseCut: 野外语言图像分割
通过对 Visual Genome 数据集的扩充,我们将自然语言短语与图像区域进行分割,并处理大量物体和结构类别及其属性描述,包括颜色、形状、部分以及与图像中其他实体的关系,提出一种模块化的方法来结合类别、属性和关系线索以优化目前状况下的图 - CVPR超越本地像素统计的自监督特征学习
基于对特定变换的区分,我们提出了一种自监督特征学习的新原则,指出所学特征的泛化能力取决于较大的图像邻域大小和其能够描述的更全局的图像统计信息,这可以 better represent objects' shape and configura - CVPR适应性孪生盒网络用于视觉跟踪
通过利用完全卷积网络的表达能力,将视觉跟踪问题视为并行分类和回归问题,避免了与候选框相关的超参数,使得 SiamBAN 更具灵活性和通用性。在包括 VOT2018、VOT2019、OTB100、NFS、UAV123 和 LaSOT 的视觉跟 - 可解释的深度泛化领域分类模型
AI 模型的可解释性通常会因降低准确性而受到质疑。我们开发了一种训练策略,不仅提高了目标分类方案的解释性,同时并未降低准确性,实现方式是对决策网络作出决策的可视证据进行区域定位,其表示方法为表征哪些像素对网络决策的贡献最大的显著性图。我们的 - SuperMix:混合数据增强的监督
本文提出了一种监督式混合增强方法 SuperMix,使用牛顿迭代方法来提高效率,在对象分类和知识蒸馏任务中通过广泛的评估和消融研究验证了其有效性,将混合图像纳入蒸馏目标可显著提高结果。