Dec, 2021

响应式听觉头部生成:一个基准数据集和基准模型

TL;DR本文介绍了一种新的人脸-面对面谈话场景下,回应听众的反馈(如点头、微笑)的生成模型,并针对此场景提出了新的数据集“ViCo”,该数据集支持一系列应用,如人机交互、视频翻译和跨模态生成,同时提供了生成模型的基线。