Feb, 2025

SoFar:语言引导的方向桥接空间推理与物体操作

TL;DR本研究解决了现有视觉语言模型无法精确理解物体方向的问题,这对细致操作至关重要。我们提出了一种新颖的语义方向概念,通过自然语言以无参考框架的方式定义物体方向,并构建了OrienText300K数据集,为机器人的操作提供了更灵活的实现方式。实验结果表明,所提方法显著提升了机器人操作精度,具有广泛的应用潜力。