Apr, 2024

VASA-1:实时生成栩栩如生的音频驱动说话人脸

TL;DRVASA 框架通过单张静态图像和语音音频剪辑生成具有真实感和吸引力的说话脸部,支持实时与模拟人类对话行为的逼真头像进行互动。