BriefGPT.xyz
Ask
alpha
关键词
vision-language embedding
搜索结果 - 1
ICCV
对齐的图像 - 词表达提高跨视觉语言任务的归纳转移能力
本文研究视觉特征的表征方式,并探讨了通过将视觉识别任务和视觉问答任务各自对应的语言表示方式建立联系,以实现更好的跨任务数据迁移的方法。结果表明,这种方法比常规的多任务学习方法更有效,并且能够大幅提高在视觉识别任务和视觉问答任务上的准确率。
PDF
7 years ago
Prev
Next