Nov, 2024

评估文本和图像生成模型中的空间关系生成

TL;DR本研究解决了空间关系生成模型性能的评估问题,特别是文本到图像(T2I)模型与大型语言模型(LLMs)之间的比较。通过将LLM的输出转换为图像,我们提出了一种新的评估方法,发现LLMs在生成空间关系方面显著优于T2I模型,这一发现揭示了当前图像生成技术中的潜在不足和改进方向。