CelebV-HQ：一个大规模的视频人脸属性数据集

ECCVJul, 2022

CelebV-HQ：一个大规模的视频人脸属性数据集

CelebV-HQ: A Large-Scale Video Facial Attributes Dataset

Hao Zhu, Wayne Wu, Wentao Zhu, Liming Jiang, Siwei Tang...

TL;DR提出了一个包含 83 个面部属性注释的大规模高质量视频数据集，名为 CelebV-HQ，该数据集中包含 35666 个视频剪辑以及 15653 个身份，其可用于模型的训练与验证，通过无条件视频生成和视频面部属性编辑验证其实用性和潜力，并展示了数据集的多样性和时间连续性。

Abstract

Large-scale datasets have played indispensable roles in the recent success of face generation/editing and significantly facilitated the advances of emerging research fields. However, the academic community still lacks a video dataset with diverse →

video dataset facial attribute annotations high-quality celebrity video dataset video generation video facial attribute editing

发现论文，激发创造

CelebV-Text：一個大規模的人臉文字視頻數據集

本文介绍了 CelebV-Text 数据集，这是一个大规模、多样化且高质量的面部文本 - 视频对数据集，旨在促进面部文本到视频生成任务的研究，通过综合统计分析视频、文本和文本视频相关性，证明了 CelebV-Text 数据集的优越性和潜力，并通过广泛的自我评估显示了 CelebV-Text 的有效性和潜力。

Mar, 2023

Celeb-DF：一个用于 DeepFake 取证的大规模挑战性数据集

研究表明，AI 合成的换脸深度伪造视频越来越威胁到在线信息的可信性。为了解决此问题，研究者开发和评估了 DetectFake 算法，并提出了一个新的高质量数据集 Celeb-DF，其中包含 5639 个名人深度伪造视频，通过改进的合成过程生成，成为目前 DeepFake 识别算法和数据集的新的挑战。

Sep, 2019

VGGFace2: 跨姿态和年龄识别人脸的数据集

介绍了一个名为 VGGFace2 的大规模人脸数据集，其中包含来自 Google Image Search 的 3,310,000 张 9131 个主体的照片，通过训练在数据集上的卷积神经网络，我们展示了在所有 IARPA Janus 面部识别基准测试上的最新成果表现。

Oct, 2017

VFHQ: 一个高质量的视频人脸超分辨率数据集和基准

本论文开发了一个自动和可扩展的管道来收集高质量的视频脸部数据集（VFHQ），并证明基于 VFHQ 训练的视频面部超分辨率（VFSR）模型可以产生比基于 VoxCeleb1 训练的模型更锐利的边缘和更细的纹理，同时时序信息在消除视频一致性问题以及进一步提高视觉性能方面也起着关键作用。

May, 2022

EFHQ：多用途 ExtremePose-Face-HQ 数据集

为了解决面部数据集在处理侧面或俯仰面时深度学习模型性能下降的问题，本研究引入了一种名为 EFHQ 的新型数据集，包含了高达 45 万张在极端角度拍摄的高质量面部图像，通过训练 EFHQ 可以帮助模型在不同角度上得到良好的泛化性能，并提供了具有挑战性的交叉视角人脸验证基准，激发了在野外环境中严重姿态条件下的人脸识别研究。

Dec, 2023

iQIYI-VID: 一个大规模的多模态人物识别数据集

本文引入了 iQIYI-VID 数据集，它是用于多模式人物识别的最大视频数据集，由 600K 个 5,000 名名人的视频剪辑组成，这些视频来自于各种类型的在线视频。通过实验结果表明，多模态注意模块融合的多模态特征可以显著提高人物识别的准确性。

Nov, 2018

VoxCeleb：一个大规模的说话人识别数据集

本文介绍了一种基于计算机视觉技术的全自动管道，用于从开源媒体中创建一个大规模的必须文本无关语音识别数据集，并在其上应用和比较不同的演讲者识别技术以建立性能基线。

Jun, 2017

CelebA-Spoof：带有丰富注释的大规模人脸反欺诈数据集

本文介绍了防止虚假面孔识别的一种重要领域，即面部防欺骗。针对数量和多样性两大问题，提出了一个大规模的 CelebA-Spoof 数据集，并使用多任务框架 AENet 对现有方法进行了测试，揭示了一些有价值的观察结果。

Jul, 2020

Multiface: 神经人脸渲染数据集

该研究介绍了一个多视角，高分辨率的人脸数据集，通过进行替代卷积编码器及对条件对抗网络（VAE）进行验证，对研究区域的深度插值进行了实验讨论。

Jul, 2022

FERV39k：面部表情视频识别的大规模多场景数据集

本文介绍了最近的一个研究项目，针对静态图像表情的识别，构建了一个大规模的视频多场景数据集 FERV39k，为 FER 算法的性能评估提供了一个更实际的场景，提出了一种融合三个方面构建这种数据集的方法，并提供了四种基线框架的实验基准和对其在不同场景下性能的进一步分析，为未来的研究提出了一些挑战性问题。

Mar, 2022