BriefGPT.xyz
大模型
Ask
alpha
关键词
multimodal world model
搜索结果 - 1
用语言学习建模世界
为了与人类进行互动,代理机构需要理解人们使用的各种语言类型,将其与视觉世界联系起来,并根据这些语言进行行动。本文提出了 Dynalang,这是一种代理机构,它学习了一个多模态世界模型,预测未来的文本和图像表示,并学会根据想象的模型展开行动。
→
PDF
a year ago
Prev
Next