关键词stable video diffusion
搜索结果 - 2
- 从视频扩散先验中学习时间一致的视频深度
该研究旨在通过利用现有视频生成模型中的先验知识,将视频深度估计问题转化为条件生成问题,以降低学习难度并增强泛化能力。通过实证验证,作者提出了一种先优化空间层再优化时间层的训练策略,并通过滑动窗口策略在任意长的视频上进行推断,从而获得更具时间 - VividPose: 提升稳定视频扩散以实现逼真的人体图像动画
通过使用稳定的视频扩散 (SVD)、面部信息集成、准确对齐人体姿态和形状的控制器,VividPose 通过保持人物身份,并提供一个能处理多种身体形状和动态手部运动的坚实框架,实现了最先进的性能,并展示出在我们提出的野外数据集上的出色泛化能力