BriefGPT.xyz
Ask
alpha
关键词
adversarial regret
搜索结果 - 3
拜占庭容错的分布式在线学习:驯服恶意环境中的对手
本研究旨在研究分布式在线学习在拜占庭攻击下的表现。通过使用一类最先进的强健合并规则,我们证明,即使在存在 byzantine 参与者和对抗性环境下,分布式在线梯度下降也只能实现线性对抗性后悔界限,并且我们可以将线性对抗性后悔的常数控制在合理
→
PDF
a year ago
镜像下降和信息比率
本论文研究了镜像下降法和信息比率之间的关系,探讨了在采样信息导向时,采用合适的损失估计器和探索分布的镜像下降法和信息导向采样的贝叶斯后验遗憾上限呈现相同的下降趋势,并且本文还提供了一种有效的算法用于敌对赌博问题中,该算法的遗憾上限与信息理论
→
PDF
4 years ago
诚实面对:零和博弈最优非后悔框架
本文提出了针对分散式场景中双方零和博弈问题的算法,提供了最佳的诚实遗憾和对抗遗憾率,解决了收敛到游戏价值的对数项的开放问题,并通过乐观的镜像下降算法与鲁棒的乐观镜像下降算法的信号传递方案相结合,实现了最佳结果。
PDF
6 years ago
Prev
Next