BriefGPT.xyz
Ask
alpha
关键词
exploration challenge
搜索结果 - 2
示例中的价值惩罚辅助控制用于无奖励或演示的学习
通过添加计划的辅助控制和辅助任务的示例,本研究在基于示例的控制任务中显著提高了探索能力,并解决了价值估计超出理论限制的问题,从而大大提高了学习效率。
PDF
3 days ago
基于演示引导的强化学习及高效探索技术用于手术机器人任务自动化
本文介绍了一种基于强化学习的手术自动化算法,使用专家演示数据来提高任务探索效率并克服探索挑战。实验显示该算法在 $10$ 个手术操作任务中取得了显著的提高,并在实际机器人上展示了有效性。
PDF
a year ago
Prev
Next