关键词credit assignment
搜索结果 - 54
  • STAS: 多智能体强化学习的时空回报分解
    PDFa year ago
  • 离线预训练加速探索和表示学习
    PDFa year ago
  • 面向合作多智能体强化学习的双自我感知价值分解框架(无个体全局最大值)
    PDFa year ago
  • 多智能体价值分解的对比身份感知学习
    PDF2 years ago
  • 对比内省,识别强化学习中的关键步骤
    PDF2 years ago
  • RACA: 基于关系感知的多智能体深度强化学习中的即时合作信用分配
    PDF2 years ago
  • 前序特征
    PDF2 years ago
  • 能量模型微观推断极限下的反向传播:预测编码、平衡传播和对比性赫布学习的统一
    PDF2 years ago
  • 分层强化学习中的信用分配
    PDF2 years ago
  • AAAIHindsight 网络信用分配:离散随机单元网络中高效的信用分配
    PDF3 years ago
  • 通过广播全局误差向量进行信用分配
    PDF3 years ago
  • 分解 Soft Actor-Critic 方法用于合作多智体强化学习
    PDF3 years ago
  • 丘脑皮质通路对神经系统中信用分配的贡献
    PDF3 years ago
  • 模型无关强化学习中的反事实信用分配
    PDF4 years ago
  • Shapley Flow:一种基于图的模型解释方法
    PDF4 years ago
  • 轨迹空间平滑的学习引导奖励
    PDF4 years ago
  • 多智能体强化学习中的图卷积值分解
    PDF4 years ago
  • 离策略多智体分解策略梯度
    PDF4 years ago
  • 具有图卷积通信的反事实多智体强化学习
    PDF4 years ago
  • 用于深度多智能体强化学习的 Q 值路径分解
    PDF4 years ago