Oct, 2023

Transformer 在上下文中如何学习超越简单函数?学习表示的案例研究

TL;DR大型语言模型在转换器架构的基础上展现了卓越的上下文学习能力,本研究旨在深入了解更复杂的情境中的上下文学习,并通过研究表示学习来探索其机制和性能。