Nov, 2023

GPT4Motion:基于 Blender 定向 GPT 规划的文本 - 视频生成脚本化物理动作

TL;DRGPT4Motion 是一个无需训练的框架,结合 GPT 等大型语言模型的规划能力、Blender 的物理仿真强度以及文本到图像扩散模型的优秀图像生成能力,用于增强视频合成的质量,通过生成 Blender 脚本并与文本提示对齐,生成具有连续物理动作的高质量视频,从而提供了文本到视频研究的新视角。