关键词natural policy gradient method
搜索结果 - 2
  • 离散折扣马尔可夫决策过程中熵正则化误差的尖锐估计
    PDFa month ago
  • 线性规划的费舍尔 - 饶梯度流和状态 - 动作自然策略梯度
    PDF3 months ago
Prev
Next