Dec, 2023

SingingHead: 用于歌唱头部动画的大规模 4D 数据集

TL;DR我们收集了一个高质量的大规模歌唱头部数据集,SingingHead,它包括来自 76 个个体和 8 种音乐类型的超过 27 小时的同步歌唱视频、3D 面部动作、歌唱音频和背景音乐。结合 SingingHead 数据集,我们提出了一个统一的歌唱面部动画框架 UniSinger,实现了通过歌唱音频驱动的 3D 歌唱头部动画和 2D 歌唱肖像视频合成。与 SOTA 的 3D 面部动画和 2D 肖像动画方法进行了广泛比较实验,证明了歌唱头部动画任务中歌唱特定数据集的必要性以及我们统一面部动画框架的良好性能。