Mar, 2022

走向视觉功能学习:一个为功能分割和识别设定的基准

TL;DR本文介绍了一个大规模多视角 RGBD 视觉可供性学习数据集及其基准测试方法,它包含了来自 37 种对象类别、配有 15 种视觉可供性类别和 35 种杂乱 / 复杂的场景的 47210 个 RGBD 图像。我们提出了一个名为 ARNet 的【可供性识别网络】,证明了该数据集的挑战性以及提出的新的强大的可供性学习算法的明确前景。