Sep, 2024
无训练对象部分增强技术:无缝提升细粒度零样本图像描述
TROPE: TRaining-Free Object-Part Enhancement for Seamlessly Improving
Fine-Grained Zero-Shot Image Captioning
TL;DR本研究解决了细粒度数据集在零-shot图像描述中存在的不足,尤其是在细微对象部分与属性的区分能力不足的问题。通过引入无训练对象部分增强技术(TROPE),精细化描述了对象部分细节,提升了描述质量。研究结果表明,TROPE显著提高了各类零-shot图像描述方法的表现,并在细粒度数据集上达到了最先进的成果。