Sep, 2023

通过视角旋转和关系推理进行空间和视觉角度参考的实体引用理解

TL;DR通过构建基于3D体验的坐标系、转化接收者的位置与方向,以及模拟语言、姿势、视觉和空间位置的多元合作推理,本研究提出了一种REP方法来解决在共享的物理环境中,基于语言和手势指引接收者定位目标物体的视角和空间问题。实验结果表明REP方法在YouRefIt上的准确率相对其他现有算法提高了5.22%。