Feb, 2024

DOZE: 动态环境中开放词汇零射击物体导航的数据集

TL;DR零射对象导航 (ZSON) 需要在陌生环境中自主定位和接近看不见的物体,它是体验智能领域中的一项特别具有挑战性的任务。我们提出了一个在动态环境中进行开放词汇的零射对象导航数据集 (DOZE),包括十个高保真度的 3D 场景及超过 18,000 个任务,旨在模拟复杂的实际情景。通过在 DOZE 场景中引入多个移动人形障碍物、大量的开放词汇物体、具有多样属性的物体和有价值的文本提示,我们解决了现有数据集在动态环境中的冲突检测方面的局限性。我们在 DOZE 上测试了四种有代表性的 ZSON 方法,揭示了现存方法在导航效率、安全性和物体识别准确性方面还有很大改进空间。