Aug, 2024

Openstory++:一种针对实例感知的开放域视觉叙事的大规模数据集和基准

TL;DR本研究解决了现有图像生成模型在处理长文本上下文时实例一致性不足的问题。作者提出了Openstory++,一个结合了高级实例特征标注的大规模数据集,并开发了注重实体中心的图像-文本生成方法。结果显示,该数据集在促进高质量视觉叙事模型的发展方面具有重要影响。