Aug, 2024

R2G:在三维场景中进行推理以实现落地

TL;DR本研究旨在解决三维场景中目标物体落地的可解释性问题。提出的R2G模型通过构建基于语义概念的场景图,动态模拟对象间的注意力转移,从而实现更高概率的目标物体落地过程。实验结果表明,R2G在保持以前工作成果的情况下,显著提高了结果的可解释性,为三维语言落地开辟了新路径。