关键词sample efficiency
搜索结果 - 428
  • 强化学习中抽象和基于潜力的奖励塑形的样本效率研究
    PDF3 months ago
  • ICLR基于树搜索的随机执行延迟下的策略优化
    PDF3 months ago
  • 基于模型内在动机的离策略学习与主动在线探索
    PDF3 months ago
  • 利用不变性学习基于动作的表示
    PDF3 months ago
  • 映射路径规划中具等变性的模型集与正则化
    PDF4 months ago
  • ViSaRL:人眼显著性引导的视觉强化学习
    PDF4 months ago
  • MAMBA: 一种适用于元强化学习的有效世界模型方法
    PDF4 months ago
  • 借宝于邻:针对多模态学习的上下文学习在缺失模态和数据稀缺情况下的应用
    PDF4 months ago
  • RLingua:利用大规模语言模型提高机器人操作中的强化学习样本效率
    PDF4 months ago
  • AAAI揭示幼儿启发式奖励转换在目标导向性强化学习中的重要性
    PDF4 months ago
  • 自动评估的正确方法:使用合成数据进行模型评估
    PDF4 months ago
  • ActiveAD:面向规划的主动学习用于端到端自动驾驶
    PDF4 months ago
  • 动态评估的再审查:大型语言模型的在线调整
    PDF4 months ago
  • 定制非平稳求解器用于扩散和流动模型的快速采样
    PDF4 months ago
  • 高效零点 V2:以有限数据掌握离散与连续控制
    PDF4 months ago
  • 快照强化学习:利用先前轨迹提高效率
    PDF4 months ago
  • 基于模型的方法提高强化学习效率:借助专家观察
    PDF4 months ago
  • 具有动力学感知奖励的样本高效偏好强化学习
    PDF4 months ago
  • 对称感知强化学习在部分可观测条件下软手腕机器人装配中的应用
    PDF4 months ago
  • LLM 如何引导强化学习?一种基于价值的方法
    PDF4 months ago