ICCVAug, 2023

基于扩散的图像标注及检索在文化遗产中的应用

TL;DR通过生成式视觉 - 语言模型来增强艺术品数据集,以应对文化遗产领域中有限的注释数据和领域偏移,提高模型对艺术特征的理解和生成恰当术语的能力。