BriefGPT.xyz
大模型
Ask
alpha
关键词
text conditioning
搜索结果 - 3
重新考虑分数蒸馏作为图像分布之间的桥梁
通过最优成本传输路径的观点,我们提出了一种新的方法,通过校准源分布的文本条件,可以在许多领域中产生高质量的生成和翻译结果,并击败专用方法的性能。
PDF
21 days ago
ICLR
潜在扩散模型的人类对齐分析
在这项工作中,我们分析了大规模数据训练的扩散模型对于三选一任务中人类响应的表示对齐情况,发现尽管其与人类响应的对齐程度与仅在 ImageNet-1k 上训练的模型相当,但去噪 U-Net 的对齐层主要为中间层而非瓶颈层,而且文本条件对于高噪
→
PDF
4 months ago
通过文本到视频模型的调整实现多样和一致的音视频生成
生成多样化和逼真的视频,根据语义类别广泛的自然音频样本进行引导。采用了基于轻量级适配器网络的方法,将音频基础表示映射到文本 - 视频生成模型所期望的输入表示,实现了对文本、音频以及文本和音频的生成视频。在三个数据集上验证了该方法,展示了生成
→
PDF
9 months ago
Prev
Next