Feb, 2021

从自然语言监督中学习可转移的视觉模型

TL;DR通过预测图像与文本配对来预训练计算机视觉系统,使其可以从自然语言描述中直接学习视觉概念,从而实现零样本迁移,并在多个计算机视觉任务上展现出竞争力。