Aug, 2024

从专家演示中推断非线性连续约束函数的正-未标记约束学习(PUCL)

TL;DR该研究解决了从专家演示中推断未知约束的问题,提出了一种新颖的正-未标记约束学习(PUCL)算法。该方法通过将演示数据视为正数据并生成可能的未标记数据,灵活学习复杂形状的约束边界,成功推断连续非线性约束,并在机器人任务中表现优越,提升了约束准确性和策略安全性。