Nov, 2023

文本到图像模型的整体评估

TL;DR对于最近的文本到图像模型,我们缺乏对其能力和风险的全面定量理解。为了填补这个空白,我们引入了一个新的基准,即文本到图像模型的整体评估(HEIM)。我们鉴定了 12 个方面,包括文本与图像的对齐、图像质量、美感、原创性、推理能力、知识、偏见、毒性、公平性、鲁棒性、多语性和效率。我们在这个基准上评估了 26 个最先进的文本到图像模型,结果表明没有单一模型在所有方面都表现出色,不同模型展示了不同的优势。我们透明地发布了生成的图像和人工评估结果。