关键词sample efficiency
搜索结果 - 424
  • 元梯度搜索控制:提高 Dyna 风格规划效率的方法
    PDF5 days ago
  • 基于内在动机反馈图的强化学习在缺货库存控制中的应用
    PDF6 days ago
  • MEReQ:最大熵残差 Q 逆强化学习用于样本高效对齐
    PDF8 days ago
  • ICML具有广义函数近似的考虑不确定性的无奖励探索
    PDF8 days ago
  • 等变离线强化学习
    PDF12 days ago
  • CoDreamer:基于通信的分散式世界模型
    PDF13 days ago
  • ICML改进 GFlowNets 使用蒙特卡罗树搜索
    PDF13 days ago
  • 近似等变神经过程
    PDF13 days ago
  • 想象策略:利用生成点云模型学习操作策略
    PDF15 days ago
  • 利用局部性提高机器人操作中的样本效率
    PDF17 days ago
  • 利用最大多样性微调解锁大型语言模型的规划能力
    PDF17 days ago
  • BabyView 数据集:婴儿和幼儿日常经历的高分辨率自我中心视频
    PDF18 days ago
  • FunBO:基于 FunSearch 的贝叶斯优化的发现式获取函数
    PDF25 days ago
  • ICML有限资源下的优质多样性
    PDFa month ago
  • 高效深度多智能体强化学习的表示学习
    PDFa month ago
  • 从示范中进行情节主动强化学习:给我一个像这样的例子
    PDFa month ago
  • 大型语言模型提升样本效率的推荐系统
    PDFa month ago
  • ICML在令牌世界中学习玩 Atari 游戏
    PDFa month ago
  • 通过即时状态条件的动作抽象实现高效蒙特卡罗树搜索
    PDFa month ago
  • 学习搜索空间分割的多目标神经架构搜索
    PDFa month ago
Prev