BriefGPT.xyz
Ask
alpha
关键词
high-resolution tasks
搜索结果 - 1
双窗口训练高分辨率视觉 Transformer
高效训练和推理高分辨率视觉 Transformer 模型的新策略是只保留 N 个随机窗口的高分辨率输入,通过学习窗口内的标记间的局部交互和窗口间的全局交互,模型能够直接处理高分辨率输入。这种策略在使用相对位置嵌入(如旋转嵌入)时表现出了显著
→
PDF
9 months ago
Prev
Next