关键词temporal-difference
搜索结果 - 3
  • ICML折扣因子作为增强学习中的正则化器
    PDF4 years ago
  • 一种贪心方法用于适应时序差分学习的迹参数
    PDF8 years ago
  • LSTD ($λ$) 的收敛速率和误差界
    PDF10 years ago
Prev
Next