BriefGPT.xyz
Ask
alpha
关键词
dynamic regret bounds
搜索结果 - 2
分布式在线学习的优化梯度跟踪
本文提出了一种基于广义梯度跟踪(GGT)框架的去中心化在线学习算法,并使用新的半定编程分析理论对其性能进行了理论分析和优化,进而得到实际数据集上的优异表现。
PDF
a year ago
对漂移进行对冲:在非稳态环境下学习优化
介绍针对非静态赌博机环境的最新数据驱动决策算法,采用了随机和对手式学习算法的非传统结合方法,通过滑动窗口 - 置信界算法,针对各种非静态赌博机问题实现了最优动态遗憾边界,并通过数字实验验证了算法的超越性能。
PDF
5 years ago
Prev
Next