- 物体识别基准的进展是否改善了现实世界的泛化能力?
通过对全球家庭物品的两个数据集进行广泛的实证评估,我们首先确定了标准基准和现实世界地理转变之间的进展差距,接着通过测量不同地区性能的差异,研究了模型在地理上的泛化能力,并发现了地理差异的增加是传统基准进展的副作用。最后,我们强调了在更具代表 - 使用解剖学特征和迭代学习进行自监督优化的手势估计方法
研究报告提出了一种自我监督学习框架,结合手势估计和手势识别,用于解决手势识别在复杂场景中的困难,以提高手动组装场景下的活动识别的准确性和鲁棒性。
- 使用方向边界框进行物体检测的环境条件评估,用于增强现实应用
该研究提出了一种新的方法,使用定向边界框与深度识别网络来改善增强现实中场景分析和物体识别的性能和处理时间,该方法使用 DOTA 数据集和一个模拟不同环境、照明和获取条件的合成数据集进行评估,结果表明该方法在大多数测试条件下能够更好地识别小物 - 基于几何证据聚集的物体检测
本文提供了一种基于形状模板的方法,该方法包括选择、收集和组合图像边缘线段的几何证据,旨在从背景中精确找到目标对象,并能识别出目标对象的语义属性。通过解决全局最优组合优化问题,该方法具有较好的通用性和环境适应性,显示了在对象识别的过程中某些类 - 通过后光学字符识别文本处理提取简历信息
本研究旨在使用目标检测和自然语言处理技术,通过分类预处理文档并使用 DistilBERT 等模型进行信息提取,比较模型的 F1 分数变化,据此提出了一种调用预训练模型完成简历信息提取的方法。
- 归纳学习获取物体拓扑特征
采用归纳学习的方法,提出了基于对象骨架的拓扑结构的形式化表示,并实现了 “寻求共同点” 的归纳过程,从经验主义推进到合理主义的目标。
- 基于三维点云数据的三维对象和场景的分类、识别、分割和重构:综述
本文综述了现有的三维点云分析技术及其算法、应用场景和目标,介绍了使用的数据集和评估指标,并比较了现有解决方案的性能,最后分析了当前技术面临的挑战和吸引人们注意的未来趋势。
- 一个新生儿体现的图灵测试:用于视角不变目标识别
通过新生儿体验的图灵测试实验方法,该研究发现虽然基于深度强化学习代理及其内在动机的机器可以自发发展类似于新生小鸡的视觉引导行为,但在物体识别任务上,机器仍远远不能达到类似新生宝宝的表现水平。
- EXOT:具备退出功能的物体跟踪器,用于安全操作移动物体的机器人
本文提出了一种名为 EXOT 的安全机器人操作技术,采用基于外部分布的分类器以提高目标物体的识别准确性,并在 TREK-150 和 RMOT-223 数据集上进行了评估,在 UR5e 机器人上测试了其实时跟踪能力,输出了高达 38% 的高出 - 性能优化的深度神经网络正在演变成更差的下颞顶叶视觉皮层模型
本文发现,尽管深度学习神经网络在图像识别任务上比人类表现更好,但它们不能很好地预测自然图像在颞下皮层 (IT cortex) 的神经响应,我们提出了神经协调器,通过该工具可以纠正这个问题。
- CVPRObjectFolder 基准测试:神经和实体对象的多感官学习
介绍了 ObjectFolder Benchmark,这是一个围绕着视觉、听觉和触觉的多感知目标中心学习的基准套件,包括对象识别、重建和操作。同时引入了 ObjectFolder Real 数据集,包括 100 个真实物品的多感知测量,重点 - CVSNet: 大脑中枢视觉系统的计算机实现
本研究提出了一种基于类似人脑中央视觉系统的神经网络 - CVSNet,该模型拥有不同的基础块及信息流,通过与其他模型的对比试验,CVSNet 在计算机视觉领域的目标识别任务中表现出了高效性和合理性。
- 深度神经网络能否充当人类视觉感知的行为模型?
本文回顾了当前深度神经网络在作为人类核心物体识别合适的行为模型方面存在的证据,并指出深度神经网络作为计算模型的质量是一个多维概念,需要在建模目标方面达成明确的理解与共识。本文通过分析大量的人类感知和深度神经网络核心物体识别能力的心理物理和计 - 通过人机交互进行连续学习 —— 重复互动中人类对连续学习机器人的认知
本论文研究了如何将基于连续学习模型的目标识别系统与移动机器人 Fetch 结合起来,以便使机器人能够在与人类用户的多个交互中继续学习。通过与 60 名参与者进行的实验,作者发现,如果机器人忘记了之前学过的目标,参与者对于连续学习机器人的信任 - 使用高分辨率触觉传感器的基于 CNN 的物体识别方法
本文介绍了一种基于高分辨率压力传感器和卷积神经网络的两种方法,对接触对象进行分类。这些方法包括利用预训练的卷积神经网络或使用自定义 CNN 进行分类,并测试了 11 个配置的性能表现,提供了与当前触觉对象识别技术的比较讨论。
- 自我中心的分层视觉语义
本文提出了一种算法,通过递归识别物体的视觉属于和视觉特征来实现物体识别,从而实现了基于词义层次结构的物体识别,进一步推动了人机交互的研究。
- 真实交通标志变化对 YOLOv7 目标识别模型的影响
研究交通标志改变对物体识别模型的影响,发现在不太可能的条件下暴露于修改的交通标志下,物体识别模型的准确性显著降低。这项研究强调了提高物体检测模型在现实场景中的鲁棒性的重要性,需要进一步研究来提高它们的准确性和可靠性。
- 分布式实例分割:用潜在的 MaskRCNN 模型建模不确定性和高置信度预测
本文提出一种基于概率分布的实例分割方法,利用潜在编码来建模物体掩膜的可能假设,从而降低机器人应用中的临界错误率。在实际服装拣选机器人上,该方法成功降低了错误率并提高了性能。
- 毫米波雷达目标识别系统性研究
利用商用毫米波雷达测试其在识别目标、实时追踪人员、定位物体等任务中的实用性和性能,并发现并解决测试过程中的潜在问题,为使用不同深度学习算法实现最佳的目标识别性能提供了广泛的实验数据。
- ICLR强健不变表示中的领域通用性
本文研究对象识别中不变表示的泛化性,经过广泛实验,我们证明了不变模型学习到的非结构化潜在表示对分配偏移具有鲁棒性,因此使不变性成为有限资源环境中训练的理想属性。