Mar, 2024

WorldGPT: 一个受 Sora 启发的视频 AI 代理,将文本和图像输入作为丰富的世界模型

TL;DR通过使用基于 Sora 的多模态学习,利用文本提示和相关图像来构建熟练的世界模型框架,该方法在维护时间一致性和确保动作流畅性方面表现出强大的效果和创新性。