May, 2023

基于语义先验精细调整的弱监督视觉 - 文本链接

TL;DR论文提出了一种基于弱化监督的视觉文本对齐模型 SPRM,通过组合输出的两个模块的预测结果学习文本短语和边界框之间的对应关系,达到了最先进的实验效果,并且在使用少量训练样例时也具有竞争性能。