关键词worst-case guarantees
搜索结果 - 6
  • ICML强化学习增强的缓存:实验研究
    PDF3 years ago
  • 固定数据集策略优化中悲观主义的重要性
    PDF4 years ago
  • 超越置信区间:坚实的贝叶斯不确定性集合用于强韧 MDPs
    PDF5 years ago
  • 随机一阶方法:通过潜力函数的非渐近和计算机辅助分析
    PDF5 years ago
  • NIPS稳健 MDP 的严格贝叶斯模糊集
    PDF6 years ago
  • 跟随领袖如果可以,如果必要则对冲
    PDF12 years ago
Prev
Next