Apr, 2025

上下文结构:表示学习机制

TL;DR本论文建立了上下文结构理论,以数学方式描述表示学习或预训练的机制。研究表明,表示是通过输入X与上下文变量A之间的关联学习得出的,优化的表示能够在适应上下文的任务中表现出色,这意味着仅仅增加模型大小会导致回报递减,进一步的进展需要优化上下文。