Jan, 2025

基于运动变形的身份保留视频配音

TL;DR本研究针对现有视频配音方法无法有效保留身份特征的问题,提出了一种新的框架IPTalker。该框架通过变压器基础的对齐机制和运动变形策略,能够实现音频与参考身份的高保真对接,显著提升了生成视频的真实感、唇动同步性和身份一致性,从而在高质量身份一致性视频配音领域树立了新的标杆。