Oct, 2022

基于 CLIP 的细粒度文本图像人员再识别

TL;DR提出了一种基于 CLIP 驱动的细粒度信息挖掘框架 (CFine),旨在为 TIReID 提供强大的多模态知识,通过细粒度信息挖掘,建立跨模态对齐,并在多个基准测试上显示了其优越的性能。