ICCVAug, 2023
基于扩散的图像标注及检索在文化遗产中的应用
Diffusion Based Augmentation for Captioning and Retrieval in Cultural Heritage
Dario Cioni, Lorenzo Berlincioni, Federico Becattini, Alberto del Bimbo
TL;DR通过生成式视觉 - 语言模型来增强艺术品数据集,以应对文化遗产领域中有限的注释数据和领域偏移,提高模型对艺术特征的理解和生成恰当术语的能力。