BriefGPT.xyz
大模型
Ask
alpha
关键词
co-attentional
搜索结果 - 1
ViLBERT:预训练无任务束缚的视觉语言表示,用于视觉与语言任务
ViLBERT 是一种用于学习图像内容和自然语言的任务不可知联合表示的模型,并通过在多模态两个流中处理图像和文本输入,通过相互关注变压器层实现交互。我们通过在大型自动收集的概念字幕数据集上执行两个代理任务来预训练我们的模型,然后通过仅对基础
→
PDF
5 years ago
Prev
Next