Jan, 2020

在成本函数不确定情况下从局部最优演示中学习约束

TL;DR本文提出一种从局部最优演示中学习参数约束的算法,并使用混合整数线性规划 (MILP) 中的 Karush-Kuhn-Tucker (KKT) 最优条件来学习与演示本地最优性一致的约束条件,提供了恢复安全/不安全集合的保守性理论保证,分析了使用局部最优演示时约束可学习性的限制,评估了该方法在高维约束和系统上的性能。例子表明,它优于现有的约束学习方法,并可以有效地用于在环境中计划新的符合约束条件的轨迹。