关键词stochastic environments
搜索结果 - 25
  • 利用可行集的曲率在在线凸优化中获得快速速率
    PDF4 months ago
  • 基于混合正则化的优化探索:针对偏向监控的对数遗憾与对抗鲁棒性
    PDF5 months ago
  • 苏格拉底的怀疑回声:在校准的证据强化学习中拥抱不确定性
    PDF5 months ago
  • 基于价值的多目标强化学习中的价值函数干扰和贪婪动作选择
    PDF5 months ago
  • 突破极限:重塑强化学习中的奖励
    PDF5 months ago
  • 基于价值的多目标强化学习在随机环境中的实证研究
    PDF6 months ago
  • 最佳的两个世界:随机和对抗的凸函数追踪
    PDF8 months ago
  • 随机环境下的预期流网络与两人零和游戏
    PDF9 months ago
  • 面向随机驾驶环境的不确定性感知决策变换器
    PDF9 months ago
  • 通过批处理学习实现双模态环境中强化学习智能体的稳定训练
    PDFa year ago
  • 基于数据驱动的悔恨平衡在线模型选择策略
    PDFa year ago
  • 解决持续任务强化学习中无界状态空间问题
    PDFa year ago
  • DiSProD: 可微分的分布符号传播规划方法
    PDFa year ago
  • 多目标强化学习中随机环境和局部决策问题的解决
    PDF2 years ago
  • USHER: 无偏采样的回顾经验回放
    PDF2 years ago
  • 不能只依赖运气:决策 Transformer 和 RvS 在随机环境中的失败
    PDF2 years ago
  • 基於強化學習的探索方法綜述
    PDF3 years ago
  • ICML用于规划的矢量量化模型
    PDF3 years ago
  • 在随机和对抗线性赌博机中同时实现近似实例最优性和极小化最优性
    PDF3 years ago
  • 情境随机赌博问题中的模型选择
    PDF4 years ago
Prev