无纹理物体识别:一种基于边缘的方法
机器学习在物体检测和机器抓取的 6D 姿态估计方面取得了巨大进展,然而,由于视觉线索较少和卷积神经网络对纹理的偏好,无纹理和金属物体仍然带来了显著挑战。为了解决这个问题,我们提出了一种注重学习 CAD 模型并强调物体形状特征的无纹理方法。通过在训练数据渲染过程中对纹理进行随机化处理,以使焦点集中在学习物体形状特征上,消除了在生成训练数据时对真实物体实例或最终外观的需求。我们使用了专门为工业机器人设置并特色为无纹理和金属物体的 TLESS 和 ITODD 数据集进行评估。无纹理性还增强了对图像扰动(如成像噪声、运动模糊和亮度变化)的稳健性,这在机器人应用中很常见。代码和数据集公开在 github.com/hoenigpeter/randomized_texturing。
Feb, 2024
本研究介绍了 T-LESS 数据集,用于计算纹理少的刚性物体的 6D 位姿,该数据集包括测试和训练图像,并提供两种类型的 3D 模型,同时揭示了该领域面临的挑战 - 尤其是在存在显著遮挡的情况下.
Jan, 2017
通过合成数据训练的客户端服务器基于增强现实的应用,展示了在边缘设备上对金属和无纹理工业物体进行最先进的姿态估计。定性评估一个 AR 辅助的分类任务,以及对渲染结果和在 HoloLens 2 上记录的真实世界数据的定量评估揭示了其在真实世界中的适用性。
Feb, 2024
本文提供了一种基于形状模板的方法,该方法包括选择、收集和组合图像边缘线段的几何证据,旨在从背景中精确找到目标对象,并能识别出目标对象的语义属性。通过解决全局最优组合优化问题,该方法具有较好的通用性和环境适应性,显示了在对象识别的过程中某些类型的通用处理的潜力。
Jun, 2023
本研究提出了一个框架,该框架将多种基于纹理的技术与 CNN 主干结合起来,以提取与图像纹理相关联的最相关特征,使模型可以以自我选择的方式进行训练,并在几个基准数据集上展现了最新的成果。
Jun, 2022
本文提出了一种基于灰度差异矩阵和局部二值模式特征的特征表示和基于 K-means 聚类的图像采集算法,用于收集更高效的纹理图像数据库,并通过一些先进的纹理分类技术进行了性能评估。
Mar, 2018
本文研究了人类视觉系统(HVS)的三个重要特征(形状,纹理和颜色)对物体分类的贡献,构建了一个人形视觉引擎(HVE),分别从图像中计算形状,纹理和颜色特征,然后将特征向量连接以支持最终分类,并利用 HVE 总结和排序三个特性对目标识别的贡献,并开源 HVE 引擎及相关数据集。
Jul, 2022
在计算机视觉中,重建无纹理表面面临着独特的挑战,主要是由于缺乏满足在没有纹理信息的情况下深度和法线估计的细微需求的专门数据集。我们介绍了一种新颖的大规模数据集 “Shape2.5D”,旨在填补这一空白。该数据集包含了 364k 个帧,涵盖了 2635 个 3D 模型和 48 个独特对象,为无纹理物体重建提供了深度和表面法线图。所提出的数据集包括使用 3D 建模软件渲染的合成图像,以模拟各种照明条件和观察角度。它还包括一个包含 4672 个由深度相机捕获的真实世界子集。我们使用修改过的编码器 - 解码器网络进行的全面基准测试展示了该数据集支持从 RGB 图像鲁棒地估计深度和法线的算法开发的能力。我们的开源数据生成流水线使得该数据集可以在未来的研究中进行扩展和适应。该数据集可在 https://github.com/saifkhichi96/Shape25D 公开获取。
Jun, 2024
该文提出了一个名为 VT5000 的新 RGBT 图像数据集,包括 5000 个具有地面实况标注的空间对齐的 RGBT 图像对。 该文介绍了一种基于多级特征和注意机制的强大基线方法,用于准确的 RGBT 显著目标检测,并在 VT5000 数据集和其他两个公共数据集上优于现有技术水平。
Jul, 2020
在这篇论文中,我们提出了一种名为 TSAR-MVS 的新方法,通过过滤、细化和分割来有效解决 3D 重建中纹理缺失区域的挑战。该方法首先采用联合假设过滤技术来消除深度估计错误,然后通过迭代相关性细化和纹理感知分割方法来提高准确性和在纹理缺失区域保留细节的能力。实验证明,与大多数非学习方法相比,我们的方法在各种数据集上都显著优于其他方法,并且能够在纹理缺失区域中保持鲁棒性。
Aug, 2023