BriefGPT.xyz
Ask
alpha
关键词
update rules
搜索结果 - 3
基于赌博算法的网络拓扑与舆论动态联合学习
提出一种基于多臂赌博算法的学习算法来解决连通性结构和混合意见动态之间的联合学习问题,目的为了找到每个 agent 的更新规则并学习底层的网络同时通过减少网络误差改善预测表现,此算法在数值实验上表现出比稀疏线性回归和高斯过程回归等方法更好的效
→
PDF
a year ago
MM
Softmax Policy Gradient 方法可能需要指数时间才能收敛
该研究针对 softmax policy gradient 方法在无限时间马尔可夫决策过程中全局收敛的复杂度问题进行了探究,给出了反例并提示了在加速 PG 方法中调整更新规则或强制执行适当规则化的必要性。
PDF
3 years ago
通过 Wirtinger Flow 进行相位恢复:理论和算法
本文提出一种非凸公式的相位恢复方法,通过随机数迭代更新的规则精确地重建了信号的相位信息。此算法具有低计算复杂性并在计算和数据资源方面都非常有效。
PDF
10 years ago
Prev
Next