BriefGPT.xyz
大模型
Ask
alpha
关键词
multimodal end-to-end transformer framework
搜索结果 - 1
CVPR
训练端到端的视觉语言变换器的实证研究
该研究展示了一个名为 METER 的多模态端到端 Transformer 框架,研究了如何设计和预训练一个完全基于 Transformer 的视听模型以及它们的性能,通过在多个维度上对模型设计进行分解,并使用预训练的增强模型,达到了相对于基
→
PDF
3 years ago
Prev
Next