BriefGPT.xyz
Ask
alpha
关键词
lazydagger
搜索结果 - 1
LazyDAgger: 降低交互式模仿学习中的上下文切换
LazyDAgger 是一种互动式的模仿学习算法,通过减少监督员和自主控制之间的上下文切换次数,提高了学习和执行过程中所学策略的性能和鲁棒性,且在限制监督员负担的同时,能够在 3 个连续控制任务中平均减少 60%的上下文切换,并在 ABB
→
PDF
3 years ago
Prev
Next