BriefGPT.xyz
Ask
alpha
关键词
homogeneous and heterogeneous modalities
搜索结果 - 1
CVPR
视觉 Transformer 的多模态 Token 融合
本文提出了一个针对基于 Transformer 的视觉任务的多模态令牌融合方法(TokenFusion),可以在保持单模态 Transformer 结构基本不变的同时,学习多模态特征之间的相关性,并超越三个典型视觉任务中的最先进方法。
PDF
2 years ago
Prev
Next