关键词sequential decision-making
搜索结果 - 106
  • 多用途转换器代理:无所不能,有所专长
    PDF5 months ago
  • 线性赌博机的噪声自适应置信区间及其在贝叶斯优化中的应用
    PDF5 months ago
  • 面向使用人类反馈进行离线策略排序的强化学习
    PDF6 months ago
  • 在非稳态环境中的决策制定与策略增强搜索
    PDF6 months ago
  • 关于样本高效的离线强化学习:数据多样性,后验采样和更多
    PDF6 months ago
  • 在联邦情境腕带中利用联邦学习的力量
    PDF6 months ago
  • 风险感知的神经上下文点臂连续控制
    PDF7 months ago
  • 漫画风格视觉叙事定制生成器
    PDF7 months ago
  • 语言智能能取代 PPO 吗?对 OpenAI Gym 的初步实证研究
    PDF7 months ago
  • 用于视觉 Transformer 的高效顺序推理的令牌回收
    PDF7 months ago
  • 不完全信息博弈中的历史过滤:算法与复杂度
    PDF7 months ago
  • 大型语言模型作为训练强化学习智能体的良好策略导师
    PDF7 months ago
  • 大型语言模型的自主树搜索能力
    PDF9 months ago
  • 通过扩散学习实现目标达成
    PDF9 months ago
  • 平等的长期收益率:将静态公平概念应用于顺序决策
    PDF10 months ago
  • 在调解员反馈下的纯粹探索
    PDF10 months ago
  • 脱机环境的贝叶斯逆转移学习
    PDFa year ago
  • 深度强化学习用于稳健目标导向财富管理
    PDFa year ago
  • ICMLDIP-RL: 在 Minecraft 中的演示推断偏好学习
    PDFa year ago
  • Hindsight-DICE:深度强化学习的稳定信用分配
    PDFa year ago