Sep, 2023

从多任务演示中学习共享安全约束

TL;DR从专家演示的安全任务完成中学习约束条件的方法扩展了逆强化学习(IRL)技术到约束空间,通过利用多任务环境中自然发生的各种演示来学习更紧密的约束条件。