BriefGPT.xyz
大模型
Ask
alpha
关键词
audio-based representation
搜索结果 - 1
通过文本到视频模型的调整实现多样和一致的音视频生成
生成多样化和逼真的视频,根据语义类别广泛的自然音频样本进行引导。采用了基于轻量级适配器网络的方法,将音频基础表示映射到文本 - 视频生成模型所期望的输入表示,实现了对文本、音频以及文本和音频的生成视频。在三个数据集上验证了该方法,展示了生成
→
PDF
9 months ago
Prev
Next