BriefGPT.xyz
Ask
alpha
关键词
longvit
搜索结果 - 1
当一张图像价值 1,024 x 1,024 个词:计算病理学案例研究
本技术报告介绍了 LongViT,一种能够以端到端方式处理十亿像素图像的视觉 Transformer。我们将十亿像素图像分割成数百万个补丁,并线性投影到嵌入中。然后,我们使用 LongNet 对这个极长序列进行建模,生成捕捉了短程和长程依赖
→
PDF
7 months ago
Prev
Next