CelebV-HQ:一个大规模的视频人脸属性数据集
本文介绍了 CelebV-Text 数据集,这是一个大规模、多样化且高质量的面部文本 - 视频对数据集,旨在促进面部文本到视频生成任务的研究,通过综合统计分析视频、文本和文本视频相关性,证明了 CelebV-Text 数据集的优越性和潜力,并通过广泛的自我评估显示了 CelebV-Text 的有效性和潜力。
Mar, 2023
研究表明,AI 合成的换脸深度伪造视频越来越威胁到在线信息的可信性。为了解决此问题,研究者开发和评估了 DetectFake 算法,并提出了一个新的高质量数据集 Celeb-DF,其中包含 5639 个名人深度伪造视频,通过改进的合成过程生成,成为目前 DeepFake 识别算法和数据集的新的挑战。
Sep, 2019
介绍了一个名为 VGGFace2 的大规模人脸数据集,其中包含来自 Google Image Search 的 3,310,000 张 9131 个主体的照片,通过训练在数据集上的卷积神经网络,我们展示了在所有 IARPA Janus 面部识别基准测试上的最新成果表现。
Oct, 2017
本论文开发了一个自动和可扩展的管道来收集高质量的视频脸部数据集(VFHQ),并证明基于 VFHQ 训练的视频面部超分辨率(VFSR)模型可以产生比基于 VoxCeleb1 训练的模型更锐利的边缘和更细的纹理,同时时序信息在消除视频一致性问题以及进一步提高视觉性能方面也起着关键作用。
May, 2022
为了解决面部数据集在处理侧面或俯仰面时深度学习模型性能下降的问题,本研究引入了一种名为 EFHQ 的新型数据集,包含了高达 45 万张在极端角度拍摄的高质量面部图像,通过训练 EFHQ 可以帮助模型在不同角度上得到良好的泛化性能,并提供了具有挑战性的交叉视角人脸验证基准,激发了在野外环境中严重姿态条件下的人脸识别研究。
Dec, 2023
本文引入了 iQIYI-VID 数据集,它是用于多模式人物识别的最大视频数据集,由 600K 个 5,000 名名人的视频剪辑组成,这些视频来自于各种类型的在线视频。通过实验结果表明,多模态注意模块融合的多模态特征可以显著提高人物识别的准确性。
Nov, 2018
本文介绍了一种基于计算机视觉技术的全自动管道,用于从开源媒体中创建一个大规模的必须文本无关语音识别数据集,并在其上应用和比较不同的演讲者识别技术以建立性能基线。
Jun, 2017
本文介绍了防止虚假面孔识别的一种重要领域,即面部防欺骗。针对数量和多样性两大问题,提出了一个大规模的 CelebA-Spoof 数据集,并使用多任务框架 AENet 对现有方法进行了测试,揭示了一些有价值的观察结果。
Jul, 2020
本文介绍了最近的一个研究项目,针对静态图像表情的识别,构建了一个大规模的视频多场景数据集 FERV39k,为 FER 算法的性能评估提供了一个更实际的场景,提出了一种融合三个方面构建这种数据集的方法,并提供了四种基线框架的实验基准和对其在不同场景下性能的进一步分析,为未来的研究提出了一些挑战性问题。
Mar, 2022