BriefGPT.xyz
Ask
alpha
关键词
temporal dynamics modeling
搜索结果 - 2
利用大型语言模型增强面向动态感知的文本到视频扩散
通过设计一个创新的动态场景管理器 (Dysen) 模块,该模块可以从输入文本中提取关键动作并将其以适当的时间顺序和动态场景图 (DSG) 表示转换,从而丰富了视频的场景细节,并与主干的 T2V DM 相结合来实现高质量的文本到视频生成。
PDF
10 months ago
EMoG:使用扩散模型合成情感共同语言三维手势
本文提出了一种通过加入情感线索指导生成过程、将难以生成的姿态生成分解为关节相关性建模和时间动力学建模两个子问题,然后分别使用提出的 JCFormer 模型来明确地解决子问题的新型框架 EMoG,该方法在手势合成方面表现优异,超过了以前的现有
→
PDF
a year ago
Prev
Next