关键词sample efficiency
搜索结果 - 426
  • 通过即时状态条件的动作抽象实现高效蒙特卡罗树搜索
    PDFa month ago
  • 学习搜索空间分割的多目标神经架构搜索
    PDFa month ago
  • 深度强化学习的生成式人工智能:框架、分析与应用案例
    PDFa month ago
  • 通过样本操作提高安全强化学习的效率
    PDFa month ago
  • 适用于样本高效的物理世界建模的变压器和插槽编码
    PDFa month ago
  • 脱机增强型演员 - 评论者:在深度离线策略强化学习中自适应混合优化历史行为
    PDFa month ago
  • 生物神经元和深度强化学习在模拟游戏世界的样本效率上竞争
    PDFa month ago
  • 基于大型语言模型的高效强化学习搜索
    PDFa month ago
  • ICML一个用于离线从人类示范和反馈中学习奖励的统一线性规划框架
    PDFa month ago
  • ICLR高效的多智能体强化学习规划
    PDFa month ago
  • 智能采样:用于改进集成强化学习的自注意力和自助法
    PDF2 months ago
  • 主动偏好学习用于样本内外排序项目
    PDF2 months ago
  • 多智能体强化学习的可证明高效信息导向采样算法
    PDF2 months ago
  • 通过多令牌预测实现更好、更快的大型语言模型
    PDF2 months ago
  • 一次性图像修复
    PDF2 months ago
  • ReZero: 提高基于 MCTS 算法的效率通过及时和快速的重新分析
    PDF2 months ago
  • 竞争与组合:学习模块化世界模型的独立机制
    PDF2 months ago
  • 高回放率赋予样本高效的多智能体强化学习
    PDF3 months ago
  • 强化学习中抽象和基于潜力的奖励塑形的样本效率研究
    PDF3 months ago
  • ICLR基于树搜索的随机执行延迟下的策略优化
    PDF3 months ago