BriefGPT.xyz
大模型
Ask
alpha
关键词
multi-modal backbone
搜索结果 - 1
ICCV
UniTR: 统一高效的多模态 Transformer 用于鸟瞰表示
UniTR 是一种高效的多模态骨干网络,用于处理多传感器数据并实现准确可靠的自动驾驶系统的感知。它引入了一种模态不可知的转换编码器来处理不同的传感器数据,并通过视角不一致的传感器数据进行并行模态表示学习和自动跨模态交互,无需额外的融合步骤。
→
PDF
a year ago
Prev
Next