Dec, 2021
最优传输蒸馏与数据高效的语言监督零样本识别
Data Efficient Language-supervised Zero-shot Recognition with Optimal Transport Distillation
Bichen Wu, Ruizhe Cheng, Peizhao Zhang, Peter Vajda, Joseph E. Gonzalez
TL;DR本篇研究提出了一种在线熵最优传输方法 OTTER,使用其进行对比学习,使来自预先训练的图像和文本编码器的模型仅需要使用 3M 图像 - 文本对进行训练,就可以在 Google Open Images 和 Tencent ML-Images 上获得在零样本评估方面的强大性能。