BriefGPT.xyz
Ask
alpha
关键词
corrective interventions
搜索结果 - 2
IntervenGen:强化和高效机器人模仿学习的干预数据生成
通过 IntervenGen (I-Gen) 数据生成系统,只需借助少数人工干预,便能自主生成大量具有状态空间丰富覆盖的纠正干预数据,从而将策略的鲁棒性提高多达 39 倍。
PDF
2 months ago
LazyDAgger: 降低交互式模仿学习中的上下文切换
LazyDAgger 是一种互动式的模仿学习算法,通过减少监督员和自主控制之间的上下文切换次数,提高了学习和执行过程中所学策略的性能和鲁棒性,且在限制监督员负担的同时,能够在 3 个连续控制任务中平均减少 60%的上下文切换,并在 ABB
→
PDF
3 years ago
Prev
Next