BriefGPT.xyz
Ask
alpha
关键词
theoretical study
搜索结果 - 5
探索 Softmax 的前沿:可证明的优化、扩散模型应用与更多
通过理论研究两层 softmax 神经网络的优化和泛化性质,揭示了 softmax 函数的归一化效应对所引起的神经核矩阵的扰动性能具有利于构建良好的损失函数曲面凸区域,从而 softmax 神经网络可以在超参数多于样本数量的情况下学习目标函
→
PDF
2 months ago
程序化强化学习的理论基础
强化学习是学习未知随机环境中最佳策略的算法,本文的目标是通过理论研究,首次回答关于编程式强化学习的好策略类别、最佳策略的规模以及如何学习它们等问题。
PDF
5 months ago
锚定函数:一类用于研究语言模型的基准函数
了解基于 Transformer 的语言模型对于推进人工智能通用性至关重要,而学术研究团队面临着复杂的数据结构、未知的目标函数、高计算成本和内存需求以及推理过程缺乏可解释性等重大挑战。本文引入锚函数的概念,为研究遵循 “锚 - 键” 模式的
→
PDF
6 months ago
学习推理技能中长度概括的条件
AI agents rely on reasoning, but large language models (LLMs) have limitations in their reasoning capabilities, particul
→
PDF
7 months ago
ICML
噪声扰动梯度加速
本文提出了一个新的加速方法 AGDP, 并对噪声和不精确梯度预言机下的加速算法进行了理论研究,研究结果支持了通过 AGDP 方法的简单性及其分析,梯度噪声的交互关系以及提示改进算法以减少梯度噪声引起的误差的平均值和方差。
PDF
6 years ago
Prev
Next