CVPRMar, 2024

CustomListener:面向用户友好的听觉头部生成的文本引导响应交互

TL;DR我们提出了一个用户友好的框架 CustomListener 来实现根据自由文本信息生成自定义的监听者,通过 Static to Dynamic Portrait module (SDP) 和 Past Guided Generation Module (PGG) 来实现说话者和监听者之间的协调并维持一致性,实现可控生成。我们构建了两个文本标注的监听头数据集进行训练和评估,并进行了广泛的实验证明了我们模型的有效性。