BriefGPT.xyz
Ask
alpha
关键词
multi-layer multi-modal attention module
搜索结果 - 1
MM
基于帧聚合和多模态融合的视频人员识别框架
通过 Frame Aggregation and Multi-Modal Fusion framework 框架,将注意力机制引入 NetVLAD 模块进行视频内的人物识别,同时引入了 Multi-Layer Multi-Modal Att
→
PDF
4 years ago
Prev
Next