BriefGPT.xyz
Ask
alpha
关键词
hidden layer
搜索结果 - 4
在大型语言模型中识别线性关系概念
用于在 Transformer 语言模型的给定隐藏层中找到对应于可解释的人类概念的概念方向的线性关系概念技术(LRC)通过首先将主体和客体之间的关系建模为线性关系嵌入(LRE),并在倒转 LRE 同时使用较早的客体层,从而找到既可以作为分类
→
PDF
8 months ago
通用等变多层感知机
本文探讨了利用群论的工具证明了广泛类的等变多层感知器的普适性,其中在正则作用下拥有隐藏层足以保证等变性,并且给出了具有高阶隐藏层的等变多层感知器的普适性的普适条件。
PDF
4 years ago
神经网络的平均场分析:中心极限定理
本文通过随机分析弱收敛方法证明单层神经网络模型在隐藏单元数量和随机梯度下降迭代次数均较大时存在中心极限定理;结果表明网络在平均场极限周围的波动符合高斯分布,并且满足一些随机偏微分方程。
PDF
6 years ago
利用凸神经网络打破维度诅咒
研究神经网络单隐层的一般化性能,使用非欧几里得正则化工具,证明了它们适应未知的线性结构,而使用稀疏感应规范则可以实现高维非线性变量选择,提供了简单的几何解释,并提供了一些凸松弛的简单条件来实现相同的一般化误差界限,留下存在或不存在多项式时间
→
PDF
10 years ago
Prev
Next