Mar, 2021

LazyDAgger: 降低交互式模仿学习中的上下文切换

TL;DRLazyDAgger 是一种互动式的模仿学习算法,通过减少监督员和自主控制之间的上下文切换次数,提高了学习和执行过程中所学策略的性能和鲁棒性,且在限制监督员负担的同时,能够在 3 个连续控制任务中平均减少 60%的上下文切换,并在 ABB YuMi 机器人的物理织物操作实验中成功率比 SafeDAgger 高 60%。