BriefGPT.xyz
Ask
alpha
关键词
high-quality videos
搜索结果 - 5
魔我:身份特定视频定制扩散
提出了一个简单而有效的主题身份可控视频生成框架,称为视频定制扩散(VCD)框架,通过强化身份信息提取、注入帧间相关性并使用三个新的关键组件,实现了稳定且高质量的视频生成,对身份保留到很大程度。
PDF
5 months ago
IJCAI
Motion-Zero:基于扩散的视频生成中的零表示移动物体控制框架
我们提出了一种新颖的零样条移动物体轨迹控制框架 Motion-Zero,通过提供基于位置的先验来改善移动物体的外观稳定性和位置准确性,并利用 U-net 的注意力图在扩散模型的去噪过程中直接应用空间约束,从而进一步确保移动物体的位置和空间一
→
PDF
6 months ago
RAVE:基于扩散模型的快速一致视频编辑的随机噪声重排
通过引入 RAVE 方法,我们在视频编辑领域取得了显著成果,能够利用预训练的文本到图像扩散模型进行零样本视频编辑,生成高质量视频并保持原始运动和语义结构。RAVE 采用了一种新颖的噪声重排策略,在帧之间的时空交互中产生了时间上的一致性视频,
→
PDF
7 months ago
MicroCinema: 一种用于文本到视频生成的分而治之的方法
我们提出了 MicroCinema,这是一个简单却有效的框架,用于高质量和连贯的文本到视频生成。通过将文本到视频分为两个阶段的过程,即文本到图像生成和图像和文本到视频生成,MicroCinema 具有两个显著优势:a) 利用最新的文本到图像
→
PDF
7 months ago
文本到视频模型的概率适应
探索如何适应大规模预训练的文本到视频模型到多个下游领域和任务而无需微调的问题,我们提出了 Video Adapter,它利用了大型预训练视频扩散模型的分数函数作为概率先验来指导任务特定的小型视频模型的生成,实验结果表明 Video Adap
→
PDF
a year ago
Prev
Next