BriefGPT.xyz
Ask
alpha
关键词
interactive reinforcement learning
搜索结果 - 3
通过自适应评分学习提高交互式强化学习的反馈效率
本文提出了一种新的方法,使用由人提供的分数代替成对偏好,在交互式强化学习中提高反馈效率,该方法在机器人运动和操作任务中得到广泛评估,结果表明,该方法可以通过自适应学习从分数中高效学习接近最优策略,而无需像成对偏好学习方法那样需要更少的反馈。
PDF
a year ago
Ask-AC: 一种基于循环者评论者框架的主动式建议系统
本研究提出一种新的框架 Ask-AC,通过引入两个组成部分 Action Requester 和 Adaptive State Selector,实现了交互式强化学习中学习者主动请求咨询,与咨询者之间双向信息交流,提高了学习效率并获得了与持
→
PDF
2 years ago
AAAI
一种增强现实平台,用于通过机器人向 K-12 学生介绍强化学习
本文介绍了一个增强现实系统,使人类可以观察到机器人学习的隐藏状态,建立了人类和机器人的共同基础,并讨论了使用我们的系统在 K-12 教育活动中以及开发基于 AR 的人类循环强化学习框架的两个未来方向。
PDF
3 years ago
Prev
Next