关键词monte-carlo tree search
搜索结果 - 51
  • 不同游戏中蒙特卡罗树搜索性能的表征
    PDF21 days ago
  • 随机蒙特卡洛树搜索中的功率均值估计
    PDFa month ago
  • 多臂赌博机中的全局奖励
    PDFa month ago
  • 极值蒙特卡洛树搜索
    PDFa month ago
  • 蒙特卡洛树搜索与 Boltzmann 探索
    PDF3 months ago
  • 大型语言模型能否玩游戏?一种自我对弈方法的案例研究
    PDF4 months ago
  • 通过关注未知的蒙特卡洛树搜索提升探索能力
    PDF5 months ago
  • 成功的压力:足球伤害风险缓解和团队成功的预测模型
    PDF5 months ago
  • 多人联手绝杀一方:将 Mixture of Experts 与 MCTS 相结合以提升国际象棋
    PDF5 months ago
  • 利用对比学习学习混合整数规划问题的后门
    PDF5 months ago
  • 使用软防护的安全强化学习对分布式灵活装配线进行调度
    PDF7 months ago
  • Alpha 消除:使用深度强化学习减少稀疏矩阵分解时的填充
    PDF9 months ago
  • 进一步改进 PPO 算法:基于值导向的蒙特卡罗树搜索解码
    PDF9 months ago
  • 通过最优输运传播的蒙特卡洛树搜索
    PDF9 months ago
  • 江郡:通过解决两人零和博弈中的不可传递性来掌握象棋
    PDFa year ago
  • 多代理路径规划的蒙特卡洛树搜索:初步结果
    PDFa year ago
  • 基于强化学习的语法引导综合
    PDFa year ago
  • 在部分可观察环境中,结合元政策和蒙特卡罗规划实现可扩展的基于类型的推理
    PDFa year ago
  • 思维习惯:重用动作序列进行高效计划
    PDFa year ago
  • 了解你的敌人:在 Pommerman 中使用对手模型研究 Monte-Carlo 树搜索
    PDFa year ago
Prev