BriefGPT.xyz
Ask
alpha
关键词
autoregressive pretraining
搜索结果 - 3
用 Mamba 在视觉中进行自回归预训练
Mamba 的视觉能力可以通过自回归预训练显著增强,而且可以成功解锁其大规模模型尺寸的潜力。
PDF
25 days ago
强大的视觉表达学习者:重塑 Image-GPT
本文介绍了 D-iGPT,这是对 image-GPT 进行改进的一种方法,通过将预测目标从原始像素转移到语义标记上,实现对视觉内容的更高级理解,并通过预测可见标记来补充自回归建模,实现了更好的效果。实验证明,D-iGPT 在 ImageNe
→
PDF
7 months ago
XLNet:语言理解的泛化自回归预训练
我们提出了 XLNet—— 一种广义的自回归预训练方法,它通过最大化分解顺序的所有排列的期望似然来学习双向上下文,并且集成了 Transformer-XL 的思想,从而在 20 项任务中胜过了 BERT,包括问题回答、自然语言推断、情感分析
→
PDF
5 years ago
Prev
Next