BriefGPT.xyz
大模型
Ask
alpha
关键词
viewpoint-dependent descriptions
搜索结果 - 1
MiKASA: 3D 视觉定位的多关键锚点和场景感知变换器
我们提出了 MiKASA(多键锚点场景感知)Transformer 模型,通过自注意力机制和多键锚点技术,提高了目标识别的准确性和对空间关系的理解,同时改善了决策的可解释性。在 Referit3D 挑战中,我们的模型在 Sr3D 和 Nr3
→
PDF
4 months ago
Prev
Next