Apr, 2022

保留字幕信息:在对比图像 - 字幕检索中预防快捷学习

TL;DR采用潜在目标解码 (LTD) 方法作为优化约束来降低图像 - 标题检索 (ICR) 方法的学习捷径,以提高其一般化能力和召回率。