关键词suboptimality gap
搜索结果 - 7
  • LC-Tsalis-INF: 广义的两全其美线性上下文决策者
    PDF4 months ago
  • 腐败稳健的离线双人零和马尔可夫博弈
    PDF4 months ago
  • 可微分的 Frank-Wolfe 优化层
    PDFa year ago
  • ICMLActor-Critic 方法在离线强化学习中的可证实益处
    PDF3 years ago
  • 混洗模型下的差分隐私多臂老虎机
    PDF3 years ago
  • 凸优化问题测度空间梯度方法的收敛速度
    PDF3 years ago
  • 具有恒定子最优性差异的可线性实现 MDPs 的指数下界
    PDF3 years ago
Prev
Next