BriefGPT.xyz
Ask
alpha
关键词
perception, prediction, and planning
搜索结果 - 1
DriveLM: 基于图像问答的驾驶
我们研究了如何将在网络规模的数据上训练的视觉 - 语言模型(VLMs)整合到端到端驾驶系统中,以增强泛化能力,并实现与人类用户的互动。通过在感知、预测和规划等方面建立图结构推理的问答对模型,我们提出了 Graph VQA 任务,以模拟人类的
→
PDF
7 months ago
Prev
Next