BriefGPT.xyz
Ask
alpha
关键词
u-vit
搜索结果 - 2
Vidu: 一种高一致性、动态且技术娴熟的文本到视频生成器,采用扩散模型
Vidu 是一种高性能的文本到视频生成器,采用 U-ViT 作为骨干模型,可以单次生成长达 16 秒的 1080p 视频。Vidu 具有较强的连贯性和动态性,能够生成逼真和富有想象力的视频,同时,在某些专业摄影技术方面具备与 Sora 相媲
→
PDF
2 months ago
AAAI
基于 Transformer 的流匹配中的潜变空间编辑
通过流匹配和变压器(U-ViT)的结合,实现了简单高效的图像编辑方法,大大提高了生成模型的可扩展性和性能,并提供了对潜在结构和编辑能力的探索。通过引入一个名为 $u$-space 的编辑空间以及针对 ODE 求解器的适应性抽样解决方案,实现
→
PDF
7 months ago
Prev
Next