BriefGPT.xyz
大模型
Ask
alpha
关键词
automated evaluation pipeline
搜索结果 - 3
DiffUHaul: 图像中无需训练的物体拖动方法
通过局部的文本到图像模型的空间理解,提出了一种不需要训练的方法 DiffUHaul,用于对象拖动任务,并通过注意力掩蔽、自我注意力共享机制和扩散锚定技术来改进编辑性能,并使用 DDPM 自我注意力分桶来适应真实图像编辑。
PDF
a month ago
EditVal: 基于扩散的文本引导图像编辑方法的基准测试
通过引入 EditVal,这是一个标准化的用于定量评估文本引导的图像编辑方法的基准测试,本研究对 8 种前沿扩散编辑方法进行了基准测试,发现 Instruct-Pix2Pix 和 Null-Text 的性能最好且能保持原始图像特性,而大多数
→
PDF
9 months ago
文本到图像生成中的空间关系基准测试
本文研究基于大规模文本到图像合成 (T2I),研究其中的空间理解能力,并提出了一个评估指标 VISOR,并引入一个大规模的数据集 SR2D 以及自动化评估管道,对 T2I 模型进行了大规模实验,发现其在多对象和空间关系生成方面存在严重限制和
→
PDF
2 years ago
Prev
Next