关键词reward engineering
搜索结果 - 8
- 利用次优数据进行人类介入强化学习PDF2 months ago
- 使用课程学习和奖励工程的近端策略优化解决实际优化问题PDF3 months ago
- GOV-REK:设计鲁棒多智能体强化学习系统的受管理奖励构筑核心PDF3 months ago
- RL-VLM-F: 视觉语言基础模型反馈的强化学习PDF5 months ago
- 不仅有奖励还有约束:应用于四肢机器人的运动PDF10 months ago
- 从人类偏好中证明策略学习在上下文强化学习问题中的好处PDFa year ago
- 带有不确定规格的规划 (PUnS)PDF5 years ago
- 一种基于策略搜索的时间逻辑指定强化学习任务方法PDF7 years ago
Prev
Next