关键词non-linear function approximation
搜索结果 - 7
  • 开放问题:基于核强化学习的次优遗憾界
    PDF15 days ago
  • 无限时间平均回报马尔科夫决策过程的强化学习与多项式逻辑函数逼近
    PDF17 days ago
  • 脱机强化学习的悲观非线性最小二乘值迭代
    PDF9 months ago
  • 在线敏感采样下的低转换策略梯度与探索
    PDFa year ago
  • 关于非线性强化学习无奖探索的统计效率
    PDF2 years ago
  • 使用倒置强化学习学习相对回报策略
    PDF2 years ago
  • MADE: 探索性能通过最大化未探索区域的差异
    PDF3 years ago
Prev
Next