关键词preference-based feedback
搜索结果 - 7
  • 基于主动探索的样本有效强化学习来自人类反馈
    PDF7 months ago
  • 具有偏好反馈的差分隐私奖励估计
    PDF8 months ago
  • 通过随机化提高基于偏好反馈的强化学习的效率
    PDF8 months ago
  • 基于偏好的主动查询的情境强化学习和模仿学习
    PDFa year ago
  • 基于核函数的离线上下文对抗波动策略
    PDFa year ago
  • 基于偏好的快速适应元强化学习
    PDF2 years ago
  • 基于偏好的 Dueling Bandits 在线学习:综述
    PDF6 years ago
Prev
Next