BriefGPT.xyz
Ask
alpha
关键词
dynamic mixed-scale tokenization
搜索结果 - 1
MSViT:用于视觉 Transformer 的动态混合尺度分词
本文提出了一种动态混合尺度的 Vision Transformers 模式,通过引入条件门控机制,智能选择每个图像区域的最佳令牌规模进行处理,从而提高图像分类的精度和效率。
PDF
a year ago
Prev
Next