BriefGPT.xyz
Ask
alpha
关键词
length extrapolation problem
搜索结果 - 2
BA-SAM:可扩展的偏置注意力掩码用于分割任何模型
本文提出了 Scalable Bias-Mode Attention Mask(BA-SAM)解决图像分辨率变化对 Segment Anything Model (SAM) 的影响,并实现了零样本泛化能力。通过引入新的缩放因子和偏置模式注意
→
PDF
6 months ago
Transformer 长度外推:以位置编码为视角的调查
该研究论文对基于 Transformer 的预训练语言模型和长度外推问题进行了系统性的回顾,聚焦于可外推位置编码方法,旨在帮助读者深入理解已有方法并为未来研究提供启示。
PDF
6 months ago
Prev
Next