Jun, 2024

Pandora: 通向自然语言行为和视频状态的通用世界模型

TL;DR通过引入 Pandora,这篇论文通过大规模预训练和指导调节实现了领域通用性、视频一致性和可控性,从而在生成视频、允许实时控制和需要仅轻量级微调的模式下迈向建立更强大的通用世界模型。