机械手中的物体计数
该研究提出一种新的用于在自然场景中进行物体类别计数的方法,利用人类视觉的子数能力进行参考,能够显著提高物体类别计数的准确性,并在视觉问题回答中应用了这种方法。
Apr, 2016
本文采用大规模数据集和多阶段学习方法,使用卷积神经网络对机器人进行抓取任务,与几个基准进行比较,表现出了最先进的泛化能力。
Sep, 2015
本论文利用 MNIST 数据集通过训练 counting convolutional neural network 来探究卷积神经网络中数字特征的表示学习,实现对于行人计数场景的初步探索。
May, 2015
通过从部分观测中重建和完成其全面几何结构,并利用七自由度的拟人化机器人手进行操作,我们的方法显著提高了只有部分重建的基线的抓取成功率近 30%,并以三个不同的对象类别多次实现了超过 150 次成功抓取,这表明我们的方法在真实世界的不同方向和位置基于完成的对象形状进行预测和执行抓取姿势的一贯能力,为增强需要实际重建对象的精确抓取和操作技能的机器人应用开辟了新的可能性。
Nov, 2023
将优化方法与生成模型相结合,我们开发了一个新颖的方法来在杂乱的环境中生成五指抓取样本,并通过评估模型改进了抓取质量和碰撞概率,显著提高了在复杂情境中进行五指抓取的实用性。
Apr, 2024
该论文介绍了 MultiGrasp,一种用于多指灵巧机械手在桌面上进行多物体抓取的两阶段方法,包括生成抓前提案和执行抓取举起物体。实验结果主要集中在双物体抓取,并报告了 44.13% 的成功率,展示了对未见物体配置和不精确抓取的适应性。该框架还展示了抓取超过两个物体的能力,但推理速度较慢。
Oct, 2023
我们提出了一个新颖的互动式无类别对象计数框架,其中人类用户可以交互地提供反馈以提高计数器的准确性。我们的框架包括两个主要组成部分:一个用户友好的可视化工具来收集反馈,以及一个高效的机制来整合它。
Sep, 2023
本文提出了一种神经网络组件,可以较好地解决在自然图像中计算物体数量的问题。通过实验验证表明,该组件在 VQA v2 数据集中的数字类别上具有最先进的准确性,并在平衡配对指标上实现单模型超越集成模型。
Feb, 2018
本文提出了一种深度学习架构,用于预测机器人操作的适合抓取的位置,通过使用 RGB-D 图像输入的深度神经网络实现对单个或多个对象的多个抓取候选项的预测,实验表明该方法在 Cornell 数据集上表现优于其他方法,在掌握实验中也获得了不错的成功率。
Feb, 2018
本文基于深度学习和边缘云协作提出了机械臂抓取方法,并考虑了抓取效率和信息安全。使用 GAN 训练的编码器和解码器实现了图像加密压缩,同时保护了隐私安全,在 OCID 数据集上实现了 92% 的准确率、0.03% 的图像压缩比和 0.91 的结构差异度。
Sep, 2022