关键词sample-efficiency
搜索结果 - 24
  • ICML具有连续潜在动力的丰富观测强化学习
    PDFa month ago
  • 多任务强化学习中的高效短视探索
    PDF4 months ago
  • PREDILECT: 在强化学习中利用零样本语言推理揭示偏好
    PDF4 months ago
  • 多批次强化学习中的样本效率:对维度相关适应性的需求
    PDF9 months ago
  • 多观测视角下的样本高效学习 POMDPs
    PDFa year ago
  • ICML在线强化学习中一般覆盖条件在有效函数逼近中的可证明优势
    PDFa year ago
  • 利用离线数据加速程序生成环境下的强化学习
    PDFa year ago
  • ICLR使用目标条件策略模拟基于图的规划
    PDFa year ago
  • 通过变分稀疏门控学习鲁棒动力学
    PDF2 years ago
  • 延迟几何折扣:强化学习的另一种准则
    PDF2 years ago
  • METRO: 面向大规模自编码语言模型的高效去噪预训练,采用模型生成信号
    PDF2 years ago
  • 具可实现性和单策略集中性的离线强化学习
    PDF2 years ago
  • TRAIL: 近乎最优的次优数据模仿学习
    PDF3 years ago
  • IJCAI利用剧集记忆解决连续控制问题
    PDF3 years ago
  • 对比傅里叶特征的证明表示学习与模仿
    PDF3 years ago
  • ICML通过乐观自举和反向归纳进行原则性探索
    PDF3 years ago
  • ICML利用随机编码器最大化状态熵以进行高效探索
    PDF3 years ago
  • ICMLLTL2Action:将 LTL 指令泛化到多任务 RL 中
    PDF3 years ago
  • 基于表征空间的新颖性搜索,用于高效探索
    PDF4 years ago
  • 基于模型的随机价值梯度在连续强化学习中的应用
    PDF4 years ago
Prev