BriefGPT.xyz
大模型
Ask
alpha
关键词
vision-action pair
搜索结果 - 1
ADriver-I: 无人驾驶的通用世界模型
基于多模态大语言模型和扩散技术,我们提出了一种自主驾驶世界模型 ADriver-I,该模型以交织的视觉 - 动作对为基础,能够预测当前帧的控制信号,并使用历史的视觉 - 动作对和生成的控制信号来预测未来的帧,通过无限反馈循环,ADriver
→
PDF
7 months ago
Prev
Next