BriefGPT.xyz
Ask
alpha
关键词
modular arithmetic tasks
搜索结果 - 2
理解模块化多项式
神经网络对模块化算术任务的学习受限,无法很好地进行推广;然而,在文献中已知有一种多层感知机(MLP)网络权重的解析解适用于模块化加法任务,本文将这种解析解的类别扩展到包括模块化乘法和具有多个项的模块化加法。此外,我们展示出在这些数据集上经过
→
PDF
a month ago
学习理解:模块化算术任务中上下文学习和技能组合的出现
通过研究模块化算术任务中上下文学习和技能组合的出现,我们证明了 GPT-style transformer 模型从分布内到分布外泛化的转变,也发现了最小的能够进行分布外泛化的模型需要两个 transformer 块。
PDF
a month ago
Prev
Next