BriefGPT.xyz
Ask
alpha
关键词
grounding accuracy
搜索结果 - 2
3D 视觉定位的双属性空间关系对齐
提出了 DASANet,一种用于模型属性和空间关系特征的双重对齐网络,能够实现在语言和 3D 视觉模态之间建立联系,提高基于 3D 视觉的定位准确性。
PDF
23 days ago
DOrA:具有顺序感的三维视觉连接
DOrA 是一个使用大型语言模型的 3D 视觉指向框架,通过引入有序锚定对象,更新视觉特征并定位目标对象,在低资源和全数据场景下表现出超越当前最先进框架的优越性,分别在 1%数据和 10%数据设置下将基准提高了 9.3%和 7.8%的准确率
→
PDF
3 months ago
Prev
Next