Jul, 2023

可训练的 Transformer in Transformer

TL;DR提出 Transformer in Transformer (TinT) 的概念,在大型模板训练语言模型中,TinT 允许 transformer 在推断时模拟和微调复杂的内部模型,并通过创新的近似技术提高效率,并在多种语言建模和下游任务中验证 TinT 的内部微调过程。