BriefGPT.xyz
Ask
alpha
关键词
diffusion architecture
搜索结果 - 3
RGB↔X:使用材质和光照感知扩散模型的图像分解与合成
通过扩散模型以及逆渲染和生成图像合成的方法,我们提出了改进的模型来实现逆向渲染问题 RGB→X 和合成问题 X→RGB 的效果。我们的模型在室内场景图像领域具有高度的灵活性和真实性。
PDF
2 months ago
舞蹈生成中的 Lodge: 一种从粗到细的扩散网络,由特征舞蹈基元引导
提出了 Lodge,一种能够根据给定的音乐生成非常长的舞蹈序列的网络。Lodge 被设计为一个两阶段的粗粒度到细粒度的扩散架构,并提出了具有显著表现力的特征舞蹈基元,作为两个扩散模型之间的中间表示。
PDF
4 months ago
CVPR
DiffSal: 扩散显著性预测的音频和视频联合学习
本研究提出了一种基于扩散架构的音视频显著性预测方法(DiffSal),使用音频和视频作为条件,通过 Saliency-UNet 网络进行渐进细化来解决显著性图的生成问题,并在六个具有挑战性的音视频基准任务中取得了优秀的性能。
PDF
4 months ago
Prev
Next