关键词entropy-regularized
搜索结果 - 9
  • 解耦动作空间的正则化
    PDFa month ago
  • 改进的均场神经网络的粒子逼近误差
    PDFa month ago
  • 连续时间风险敏感强化学习的二次变差惩罚
    PDF3 months ago
  • 具有循环对称性的最优输运
    PDF7 months ago
  • 网络多智能体强化学习中局部策略迭代的全局收敛性
    PDF2 years ago
  • 带熵正则化的约束马尔可夫决策过程的双重方法
    PDF3 years ago
  • ICML最优输运的高效离散化
    PDF3 years ago
  • 计算投影鲁棒瓦瑟斯坦距离的黎曼块坐标下降方法
    PDF4 years ago
  • 具有模型误差的连续控制强化学习
    PDF5 years ago
Prev
Next