Jun, 2022

带正则化驱动和增强渲染器的知觉式对话头生成

TL;DR该论文主要介绍了他们在ACM Multimedia ViCo 2022 会话头部生成挑战中的解决方案,包括使用正则化训练广义的音频到头部的驱动程序和组装高质量的渲染器,以及利用前景-背景融合模块调整音频至行为模型和后处理生成的视频。该方案达到了听觉头部生成跟踪的第一名和说话头部生成跟踪的第二名。