May, 2024

VOODOO XP:VR 远程传输的表达性一瞬头部复原

TL;DR介绍了一种名为 VOODOO XP 的 3D 感知一次性头部复现方法,可以从任何输入驱动视频和单个 2D 肖像中生成高度表情丰富的面部表情。该方法具有实时性、视角一致性,并且可以即刻使用,无需校准或微调。在单眼视频设置和端到端虚拟现实远程呈现系统中演示了该解决方案,用于双向交流。与 2D 复现方法相比,3D 感知方法旨在保留主体的身份,并确保对新的相机姿势视角一致的面部几何,从而使其适用于沉浸式应用。我们通过一种新颖的交叉复现架构,将驱动者的面部表情直接转移给输入源的 3D 抬升模块的变压器块来展示了高度有效的分解。我们展示了一种创新的多阶段自我监督方法,该方法基于粗到细的策略,并在初始训练阶段进行了明确的面部中性化和 3D 抬升正向化。我们进一步将这种新颖的头部复现解决方案集成到一个可访问的高保真虚拟现实远程呈现系统中,任何人都可以立即从任何照片创建个性化的神经头像,并使用头戴式显示器赋予其生命。我们在大量多样的主题和捕获环境上展示了在表情丰富性和相似性保持方面的最新性能。