BriefGPT.xyz
Ask
alpha
关键词
mlp block
搜索结果 - 2
稀疏激活下的神经网络学习
许多成功的神经网络结构中的核心组件是一个具有非线性激活函数的两个全连接层的 MLP 块。我们在本文中对展示出激活稀疏性的 MLP 层的 PAC 可学习性进行了形式化研究,并呈现了多种实验结果,表明这类函数相对于非稀疏的对应物具有计算和统计上
→
PDF
10 days ago
自校正的理论认识与上下文对齐
基于一种类似于对齐任务的简化设置,我们从上下文学习的角度对自我纠正进行理论分析,显示出大语言模型通过给予相对准确的自我检查作为奖励,能够以上下文的方式改进响应。我们的理论构建突破了之前关于过于简化的线性变换器的理论,阐述了现实变换器的几个关
→
PDF
a month ago
Prev
Next