BriefGPT.xyz
Ask
alpha
关键词
visio-linguistic pretraining
搜索结果 - 2
CVPR
FLAVA:一种基础语言和视觉对齐模型
本篇研究提出了一种名为 FLAVA 的综合视觉与语言基础模型,通过使用单一的综合的通用模型,同时针对视觉和语言任务以及跨模态任务,展现出出色的性能表现。
PDF
3 years ago
MM
DeVLBert:学习去混淆视觉语言表征
本文提出了 Deconfounded Visio-Linguistic Bert 框架,解决了视觉语言预训练中的跨域问题,并通过干预学习减轻数据集偏差,从而提高了模型的泛化能力。
PDF
4 years ago
Prev
Next