关键词counterfactual regret minimization
搜索结果 - 23
  • IJCAI使用乐观在线镜像下降法来减小加权对策后悔
    PDF2 months ago
  • RL-CFR: 在具有强化学习的不完全信息扩展形式博弈中改进动作抽象
    PDF4 months ago
  • ABC 轻松统一玻尔兹曼 Q 学习与反事实遗憾最小化
    PDF4 months ago
  • PokerGPT: 通过大型语言模型的端到端轻量级解决方案,用于多人德州扑克
    PDF6 months ago
  • 纯蒙特卡罗反事实遗憾最小化
    PDF10 months ago
  • CFR-p: 带有层次策略抽象的反事实遗憾最小化及其在二人麻将中的应用
    PDFa year ago
  • 层次深度对抗性后悔最小化
    PDFa year ago
  • ESCHER: 使用历史价值函数估计悔恨值,避免在游戏中采用重要性采样
    PDF2 years ago
  • 广泛型博弈中的偏差类型和学习有效性:纠正
    PDF2 years ago
  • AAAI未知序贯决策问题和游戏的无模型在线学习
    PDF3 years ago
  • ICML关于全面博弈推理中的有效偏差类型和学习
    PDF3 years ago
  • AAAI相关对局的回顾性和序贯理性
    PDF4 years ago
  • AAAI利用量子对手在大型双人游戏中的复杂性和算法
    PDF4 years ago
  • AAAI预测性布莱克韦尔可达性加速游戏求解:联接遗憾匹配与镜像下降
    PDF4 years ago
  • ICML用于零和平衡点求解的稀疏线性规划
    PDF4 years ago
  • 组合无遗憾和 Q 学习
    PDF5 years ago
  • 深度对抗性遗憾最小化
    PDF6 years ago
  • AAAI应对策略限制的大规模扩展博弈求解
    PDF6 years ago
  • 通过折现遗憾最小化解决不完美信息博弈
    PDF6 years ago
  • ICML部分可观测深度强化学习的后悔最小化
    PDF7 years ago
Prev