BriefGPT.xyz
Ask
alpha
关键词
pooling attention
搜索结果 - 2
CVPR
MViTv2: 改进的多尺度视觉 Transformer 用于分类和检测
本文探究了多尺度视觉变换器 (MViTv2) 作为统一的图像和视频分类以及物体检测的架构,提出了一种改进版本的架构,将分解相对位置嵌入和残差池连接融入 MViTv2,并应用在 ImageNet 分类、COCO 检测和 Kinetics 视频
→
PDF
3 years ago
ICML
Poolingformer: 带池化注意力的长文档建模
本文介绍了一种二级注意力模式,Poolingformer,用于长文档建模,其第一级使用较小的滑动窗口模式来聚合周围信息,第二级使用更大的窗口来增加接受场并使用池化注意力来减少计算成本和内存消耗。实验结果表明,Poolingformer 在三
→
PDF
3 years ago
Prev
Next