Apr, 2023

TalkCLIP: 文本引导的表情语音生成

TL;DR本文提出了一种基于自然语言描述的表情可控一镜到底对话头生成方法 TalkCLIP。该方法通过引入 CLIP-based 风格编码器,将自然语言描述映射到口型样式表示中进行对齐,并能够生成受文本描述引导的具有生动面部表情的逼真谈话头。