ICCVSep, 2023

基于伪造文本的统一预训练技术用于文本 - 图像人物重识别

TL;DR该论文介绍了一种面向文本到图像人物重识别任务的统一预训练方法 (UniPT),通过构建大规模的文本标注人物数据集、使用视觉 - 语言预训练框架来对齐图像和文本模态的特征空间,解决了数据不一致性和训练不一致性的问题。UniPT 在多个数据集上取得了有竞争力的准确率。