BriefGPT.xyz
Ask
alpha
关键词
game-theoretic approach
搜索结果 - 5
基于专家建议的局部平稳数据预测
在连续机器学习领域,采用博弈论方法研究了不依赖于数据流生成源的随机特性的情况,提出了一种面向本地平稳时间序列的在线预测算法,并估计了算法的效率。
PDF
8 months ago
博弈论的鲁棒强化学习处理时耦合扰动
提出了一个新的挑战,即通过 GRAD 方法将强化学习中的时间上耦合的扰动问题视为部分可观察的两人零和游戏,并通过在该游戏中找到逼近均衡来确保智能体对于时间上耦合的扰动的鲁棒性,实验结果表明,相比于基准方法,在状态空间和动作空间中,所提出的方
→
PDF
a year ago
线性约束下的纯探索赌博机问题
本文提出了两种渐近最优的算法,基于 Track-and-Stop 方法和博弈论方法,用于寻找多臂赌博机环境中具有一定置信度的最优策略,特别考虑了带有线性约束的情况,并探讨了约束难度对问题的影响。
PDF
a year ago
联邦学习中的最优性与稳定性:博弈论方法
这篇文章研究联邦学习的优化问题,采用博弈论的思想将联邦学习看作互动的 hedonic game,提出了一种基于平均误差率的最优性概念,并给出了一种计算最优解的高效算法。文章还分析了稳定性与最优性的关系,并证明了稳定解与最优解差距的上限为 9
→
PDF
3 years ago
有限维度意见动态中 Hegselmann-Krause 模型的博弈论分析
通过对 Hegselmann-Krause 模型的同步和异步动态、博弈论方法、多项式上限和异质动态的研究,我们建立了一些策略,包括获得了终止时间的最短限制,提供了异步 Hegselmann-Krause 模型的多项式上限,以及提供了一些关于
→
PDF
10 years ago
Prev
Next