BriefGPT.xyz
大模型
Ask
alpha
关键词
diffusion-based architecture
搜索结果 - 3
LGTM: 本地到全局的文本驱动人体运动扩散模型
本研究介绍了 LGTM,一种面向文本到动作生成的新颖的本地到全局流程。LGTM 利用扩散式架构,旨在解决将文本描述准确转化为在计算机动画中语义一致的人体动作的挑战。我们通过引入两阶段的流程来克服语义差异的问题,首先使用大型语言模型将全局动作
→
PDF
2 months ago
HanDiffuser: 使用真实手表现生成文本 - 图像
HanDiffuser 是一种基于扩散的新型架构,通过在生成过程中注入手部嵌入信息,生成具有逼真手部的图像。它包括两个组件:Text-to-Hand-Params 扩散模型用于从输入文本生成 SMPL-Body 和 MANO-Hand 参数
→
PDF
4 months ago
CVPR
TryOnDiffusion:两个 UNet 的故事
本研究提出了一种基于扩散的架构,统一了两个并行 UNet,旨在在保留服装细节的同时,通过扭曲服装并令其适应不同的身体姿态和形状变化,生成着装效果图。实验结果表明,该方法在质量和多个评估指标上均取得了最先进的表现。
PDF
a year ago
Prev
Next