BriefGPT.xyz
Ask
alpha
关键词
text-to-video editing
搜索结果 - 2
ICLR
跨模态语境扩散模型的文本导向视觉生成与编辑
我们提出了一种新颖而通用的上下文扩散模型 (ContextDiff),通过将文本条件与视觉样本之间的交互和对齐引入前向和后向过程中,将上下文传播到这两个过程的所有时间步,从而促进跨模态条件建模,在文本到图像生成和文本到视频编辑的两个挑战性任
→
PDF
4 months ago
FLATTEN: 光流引导的注意力技术用于一致的文本 - 视频编辑
FLATTEN 是一种用于文本到视频编辑的训练无关方法,通过在扩散模型的 U-Net 中引入光流来提高编辑视频的视觉一致性,并且能够无缝集成到任何基于扩散的文本到视频编辑方法中,提高其视觉一致性。
PDF
9 months ago
Prev
Next