BriefGPT.xyz
大模型
Ask
alpha
关键词
multi-modal control
搜索结果 - 4
多模态条件下的三维感知图像生成和编辑
本文提出了一种新颖的端到端 3D 感知图像生成和编辑模型,通过纯噪声、文本和参考图像等多种条件输入,在 3D 生成对抗网络(GANs)的潜在空间中深入研究并提出解缠特性较好的生成策略,同时采用统一框架进行灵活的图像生成和编辑任务,实现多模态
→
PDF
4 months ago
音乐驱动舞蹈生成中的多模态控制探索
我们提出了一个统一的框架,能够生成高质量的舞蹈动作并支持多模态控制,包括流派控制,语义控制和空间控制,实验证明所提出的舞蹈生成框架在动作质量和可控性方面优于现有的方法。
PDF
6 months ago
Cocktail: 组合多模态控制以生成基于文本的图像
使用多模态混合、改进的控制规范和空间引导采样方法实现对文本条件扩散模型的多模态和空间细化控制,从而生成高品质的合成图像。
PDF
a year ago
CVPR
多模态人脸生成与编辑的协同扩散
本文提出了一种名为 Collaborative Diffusion 的模型,在不需要重新训练的情况下,利用多种单一模态扩展固有的单一模态扩散模型以实现多模态人脸生成和编辑。
PDF
a year ago
Prev
Next