BriefGPT.xyz
大模型
Ask
alpha
关键词
vilt
搜索结果 - 2
VAuLT: 增强视觉与语言 Transformer 用于社交媒体情感分类
本研究提出了 Vision-and-Augmented-Language Transformer(VAuLT),以传播大型语言模型(LM)BERT 的输出表示到 ViLT 的语言输入为核心思想,VAuLT 在包括富语言输入和情感结构在内的视
→
PDF
2 years ago
ICML
ViLT:无卷积或区域监督的视觉语言 Transformer
本文提出了一种新的 Vision-and-Language Pre-training 模型 ViLT,它是一种单体模型,与文本输入处理方式相同,并通过多模态交互步骤实现视觉输入处理。ViLT 通过简化图像输入处理过程,使得模型训练更加高效,
→
PDF
3 years ago
Prev
Next