Sep, 2024

从自我中心交互中确定3D场景可供性

TL;DR本研究解决了在3D环境中确定交互区域的难题,旨在提升具身代理与周围环境的智能交互能力。通过引入一种新任务——从自我中心交互中确定3D场景可供性,我们提出了Ego-SAG框架,以情感导向的方式聚焦于相关子区域,同时使用双向查询解码机制对特征进行对齐。实验表明,该方法具有良好的可行性和有效性,推动了领域的发展。