BriefGPT.xyz
Ask
alpha
关键词
multimodal decoder
搜索结果 - 1
GPT-4 增强型自动驾驶多模态基础:借助大型语言模型的跨模态注意力
在自动驾驶车辆领域中,准确识别指挥者意图并在视觉环境中执行语言指令是一个巨大的挑战。本文介绍了一个复杂的编码器 - 解码器框架,用于解决自动驾驶车辆中的视觉 grounding 问题。我们的 Context-Aware Visual Gro
→
PDF
7 months ago
Prev
Next