Mar, 2024

音频驱动的真人假头视频的感知质量评估比较研究

TL;DR通过进行控制性的心理物理实验,我们验证了模型预测与人工注释之间的一致性,鉴定出相对于广泛使用的度量方法更能与人类意见相符的评估指标,以填补评估研究在视觉质量、嘴唇音频同步和头部移动自然性方面的空白。我们相信我们的工作将促进性能评估和模型开发,为人工智能生成内容在更广泛的背景下提供洞察。