Feb, 2024
AVI-Talking:学习音频 - 视觉指令用于表情丰富的 3D 说话脸生成
AVI-Talking: Learning Audio-Visual Instructions for Expressive 3D Talking Face Generation
Yasheng Sun, Wenqing Chu, Hang Zhou, Kaisiyuan Wang, Hideki Koike
TL;DR利用大型语言模型指导实现具有表情细节合成能力的说话人脸生成系统,通过先理解语音信息并生成指令,再执行这些指令生成具有表情运动的生动说话人脸,实验证明该方法有效且具有一致的情感状态。