关键词tdc algorithm
搜索结果 - 3
  • 使用线性函数逼近进行策略评估的高概率样本复杂度
    PDFa year ago
  • 带模型不确定性的在线强化学习
    PDF3 years ago
  • 两个时间尺度的离线 TD 学习:对马尔可夫样本的非渐进分析
    PDF5 years ago
Prev
Next