BriefGPT.xyz
Ask
alpha
关键词
stochastic networks
搜索结果 - 5
基于局部李雅普诺夫条件的得分感知策略梯度方法与性能保证:应用于产品形式随机网络和排队系统
通过利用底层 MDP 的结构,引入了一种新的梯度估计器家族 ——SAGEs,它们可以在无需依赖于值函数估计的情况下估计策略梯度,相较于经典的 actor-critic 等策略梯度方法具有更快的收敛速度,并通过数值比较证明了其优越性。
PDF
7 months ago
模拟、演化和随机循环神经网络的改进柯尔莫哥洛夫复杂性
本文研究了模拟、演化和随机神经网络的超图灵计算能力,通过其真实权重、演化权重和真实概率的科尔莫哥罗夫复杂性进行细致的表征,并在不同网络类型间建立了无限层次的复杂性等级。通过提供这些层次结构的存在和示例,描绘了聚类越来越复杂的函数类构造它们的
→
PDF
9 months ago
更接近现实:带有不完美通信的协同 Bandit 算法
本文探讨了协作强盗问题在现实世界通信环境下的三种典型情景,并提出了相应的去中心化算法来实现可比性能并且保证产生小组遗憾次数接近最优解,同时提出了对于完美通信情况下的改进算法,最后给出了群体遗憾的最紧密的网络相关极小极大下限。
PDF
3 years ago
应用信息瓶颈原理学习神经网络分类的表示
通过研究使用信息瓶颈功能最小化来训练深度神经网络进行分类的理论论文,我们发现这种优化问题存在严重问题,方法包括使用随机神经网络、更加稳定的代价函数和设计直接实现所需属性的潜在表示的正则化项。
PDF
6 years ago
估计时变网络
本文介绍了两种新的机器学习方法来估计时间变化的网络,采用了一种顺序平滑的 $l_{1}$ 正则化逻辑回归形式,可用作标准凸优化问题,并利用通用求解器高效地解决大型网络。本文在虚拟数据集中还原时间变化网络,同时,从议员投票记录中反向构建了渐进
→
PDF
16 years ago
Prev
Next