BriefGPT.xyz
大模型
Ask
alpha
关键词
transformer-based fusion module
搜索结果 - 2
基于 Transformer 的多模态信息融合用于面部表情分析
本研究介绍了一种基于多模态特征和 Transformer 的统一框架,用于情感行为分析和表情识别任务,同时运用数据平衡和增强方法进一步提高模型性能。实验证明,该方法在 ABAW3 竞赛中在 EXPR 和 AU 方面排名第一。
PDF
2 years ago
MiniVLM: 一个更小更快的视觉语言模型
本文提出 MiniVLM,一个轻量、快速的视觉 - 语言模型,采用 two-stage efficient feature extractor 和 MiniLM 结构。MiniVLM 与大型模型相比,模型大小减少 73%,推理时间成本降低
→
PDF
4 years ago
Prev
Next