May, 2023

PLIP: 人物表示学习的语言图像预训练

TL;DR该研究提出了一种新的预训练框架用于人物表征学习,名为 PLIP,其中包括三个预文本任务:图像着色、属性预测和视觉 - 语言匹配,在一个新的大规模人物数据集 SYNTH-PEDES 上对其进行了评估并取得了优于先前方法的效果。