关键词reward engineering
搜索结果 - 8
  • 利用次优数据进行人类介入强化学习
    PDF2 months ago
  • 使用课程学习和奖励工程的近端策略优化解决实际优化问题
    PDF3 months ago
  • GOV-REK:设计鲁棒多智能体强化学习系统的受管理奖励构筑核心
    PDF3 months ago
  • RL-VLM-F: 视觉语言基础模型反馈的强化学习
    PDF5 months ago
  • 不仅有奖励还有约束:应用于四肢机器人的运动
    PDF10 months ago
  • 从人类偏好中证明策略学习在上下文强化学习问题中的好处
    PDFa year ago
  • 带有不确定规格的规划 (PUnS)
    PDF5 years ago
  • 一种基于策略搜索的时间逻辑指定强化学习任务方法
    PDF7 years ago
Prev
Next