关键词finite horizon
搜索结果 - 3
  • 强化学习中抽象和基于潜力的奖励塑形的样本效率研究
    PDF3 months ago
  • 有限时间内动态赌博机渐近最优指数策略
    PDF7 years ago
  • 有限时间内带执行延迟的脉冲控制问题
    PDF17 years ago
Prev
Next