May, 2023

检验文图生成模型图像地理代表性

TL;DR本文中,我们采用众包研究来衡量使用 DALL.E 2 和 Stable Diffusion 模型对普通名词进行生成时,生成图像对全球各地表现力的代表性。我们发现,对于没有特定国名的输入,生成的图像表现美国和印度的环境最好,其他国家的表现不如其它的。如果在输入中指定国家名称,则 DALL.E 2 的表现提升了1.44分,Stable Diffusion的表现提升了0.75分,但许多国家的总体得分仍然很低,需要未来的模型在地理上更加包容。最后,我们研究了在不进行用户研究的情况下量化生成图像在地理上的代表性的可行性。