关键词q-function
搜索结果 - 11
  • Q - 函数之差的正交估计
    PDF24 days ago
  • 离线强化学习中的潜在扩散推理
    PDF10 months ago
  • 离线增强学习与在线策略 Q 函数规范化
    PDFa year ago
  • 逆向偏好学习:无奖励函数的基于偏好的强化学习
    PDFa year ago
  • 使用层次行动探索的深度强化学习实现对话生成
    PDFa year ago
  • 基于蒸馏执行的个性化多智体强化学习训练
    PDF2 years ago
  • 演员优先的经验回放
    PDF2 years ago
  • IQ-Learn: 逆软 Q 学习用于模仿
    PDF3 years ago
  • CoinDICE:离线策略下置信区间估计
    PDF4 years ago
  • 逻辑回归 Q-Learning
    PDF4 years ago
  • 带离线修正的 Q ($λ$)
    PDF8 years ago
Prev
Next