Jul, 2020

一种基于多说话人条件混合的语音手势动画样式转移方法

TL;DR本文提出了一种名为 Mix-StAGE 的新模型,它以端到端的方式训练单个模型以服务于多个说话者,同时为每个说话者的手势学习独特的样式嵌入,该模型可以对对话风格和内容进行区分,并可轻松地更改相同输入语音的姿势样式;同时,我们还介绍了一个被设计用于研究手势生成和样式传递的新数据集 PATS,我们的 Mix-StAGE 模型明显优于以前的手势生成方法并为将手势风格传递到多个说话者提供了路径。