BriefGPT.xyz
大模型
Ask
alpha
关键词
multimodal content creation
搜索结果 - 1
AV-DiT:联合音频与视频生成的高效音频 - 视觉扩散变压器
通过使用基于 Transformer 的 diffuser,我们介绍了 AV-DiT,一种用于生成高质量真实视频的音频 - 视觉扩散变压器,具有多模式内容创作的显著效能,并在联合音频 - 视觉生成中具有最先进的性能。
PDF
23 days ago
Prev
Next