Dec, 2023

文本与图像合成对比性组合基准:统一文本与图像保真度指标的研究

TL;DRWinoground-T2I 是一个用于评估 T2I 模型组成性的基准,通过包含 11K 个复杂、高质量的对比句对来进行评估,通过比较性句对来评估各种指标的可靠性,最后提供了关于指标的优点和缺点以及当前 T2I 模型在应对复杂组成类别挑战中的能力,该基准公开提供。