Apr, 2022

ReCLIP:一种强大的零样本指代表达理解基准

TL;DR本文介绍了一种基于大规模预训练模型CLIP的零-shot基线模型ReCLIP,包含提取物体区域和处理空间关系两个组成部分,实验结果表明相较于其他基线模型, ReCLIP在指代理解任务上对真实图像的效果提升了8%。