Jul, 2023

CLIP 为视觉美学学习者带来更好的特征

TL;DR旨在提升图像审美评估(IAA)的性能,本研究提出了统一且灵活的两阶段 CSKD(CLIP-based Semi-supervised Knowledge Distillation)范式。通过特征对齐损失,该方法整合和利用多源无标签数据集,将给定的视觉编码器与现成的 CLIP 图像编码器之间的丰富特征进行对齐。在使用半监督 IAA 学习的过程中,利用无标签数据进一步增强学生模型的性能。实验证明 CSKD 在多个广泛使用的 IAA 基准测试中具有卓越性能。