Apr, 2024

高保真实时语音合成与音频驱动下的 3D 高斯状喷溅

TL;DR提出了 GaussianTalker,这是一个实时生成可调控姿势的会话头部的新框架,它利用 3D 高斯喷射(3DGS)的快速渲染能力,同时解决了直接控制 3DGS 与语音音频的挑战。