关键词model-free
搜索结果 - 38
  • 强化学习中的无模型主动探索
    PDF4 days ago
  • 无模型鲁棒强化学习及样本复杂度分析
    PDF10 days ago
  • 关于价值函数的有限表达能力及其与统计 (非) 效率的联系
    PDF4 months ago
  • 元学习线性二次调节器:一种基于策略梯度的模型无关 LQR 的 MAML 方法
    PDF5 months ago
  • 双重不均匀环境下的离线评估
    PDFa year ago
  • 使用随机特征的自监督强化学习转移
    PDFa year ago
  • 突发模型变化下的强化学习
    PDFa year ago
  • 用于处理各种机器人手臂任务的离策略深度强化学习算法
    PDF2 years ago
  • ViNL: 视觉导航和克服障碍物
    PDF2 years ago
  • 强化学习中样本高效函数逼近的通用框架
    PDF2 years ago
  • ECCV基于神经社会物理学的人类轨迹预测
    PDF2 years ago
  • 深度强化学习教科书
    PDF2 years ago
  • 带模型不确定性的在线强化学习
    PDF3 years ago
  • ICLRCASA: 冲突回避策略迭代,弥合政策改进和政策评估之间的差距
    PDF3 years ago
  • 低秩 MDP 中无模型表示学习与探索
    PDF3 years ago
  • ICML反向受限强化学习
    PDF4 years ago
  • FOCAL:通过距离度量学习和行为规范实现高效完全离线的元强化学习
    PDF4 years ago
  • EfficientDeRain: 学习像素级扩张滤波以实现高效单张图像去雨
    PDF4 years ago
  • ICML随机镜像下降法高效求解 MDPs
    PDF4 years ago
  • 广义值函数逼近的强化学习:通过受限逃避维数可证明高效方法
    PDF4 years ago
Prev