关键词efficient exploration
搜索结果 - 22
  • 具有随机停止时间的约束马尔可夫决策过程的安全增强学习
    PDF3 months ago
  • 扩散模型应用于大动作空间的情境强化学习
    PDF5 months ago
  • LLM 的高效探索
    PDF5 months ago
  • 基于虚拟行动演员 - 评论家框架的探索
    PDF8 months ago
  • 超越想象:通过世界模型最大化情节可达性
    PDF10 months ago
  • 分布式深度探索的策略包
    PDFa year ago
  • ICML在多房间迷宫环境中推断层次结构
    PDFa year ago
  • 通过认识价值估计的探索
    PDFa year ago
  • 使用基于模型的品质多样性和梯度的高效探索
    PDF2 years ago
  • MUI-TARE:未知初始位置的多智能体合作探索
    PDF2 years ago
  • 儿童和计算模型中的探索学习因果过度假设
    PDF2 years ago
  • ICML利用随机编码器最大化状态熵以进行高效探索
    PDF3 years ago
  • 基于表征空间的新颖性搜索,用于高效探索
    PDF4 years ago
  • 强化学习中的无任务探索
    PDF4 years ago
  • 马尔可夫决策过程中的主动模型估计
    PDF4 years ago
  • ICLR自主推断子任务依赖关系的元强化学习
    PDF5 years ago
  • 可转移的图探索学习
    PDF5 years ago
  • ICML基于差异性的自监督探索
    PDF5 years ago
  • 随机梯度 MCMC 的元学习
    PDF6 years ago
  • 当简单探索具有样本效率:确定随机探索达到 PAC RL 算法的充分条件
    PDF6 years ago
Prev