BriefGPT.xyz
大模型
Ask
alpha
关键词
diffusion transformers
搜索结果 - 23
DiT-Head:使用扩散变压器进行高分辨率说话人合成
我们提出了一种基于扩散变压器的新型对话头合成流程,利用音频作为条件来驱动扩散模型的去噪过程。我们的方法具有可扩展性,可以推广到多个身份,同时产生高质量的结果。通过与现有的对话头合成方法进行比较,我们对我们提出的方法进行训练和评估,并展示了我
→
PDF
7 months ago
GenTron:深入探究扩散变压器在图像和视频生成中的应用
该研究探索了用于图像和视频生成的基于 Transformer 的扩散模型,并介绍了 GenTron,它是一族使用基于 Transformer 的扩散的生成模型,扩展到文本到视频生成,并在人类评估中取得了显著的视觉质量改进。
PDF
7 months ago
可扩展的 Transformer 扩散模型
本文提出了基于 Transformer 的扩散模型。将常用的 U-Net 骨干网络替换为在潜在块上操作的 Transformer,通过 Gflops 度量前向传递复杂度分析 DiT 的可伸缩性,并证明了高 Gflops DiT-XL/2
→
PDF
2 years ago
Prev
Next