Dec, 2023

签名遇见动态规划:推广贝尔曼方程用于轨迹跟踪

TL;DR路径签名被提出作为一种强大的路径表示,能有效地捕捉路径的分析和几何特征,具有张量积快速连接路径的有用代数特性。最近,在机器学习问题中广泛采用签名进行时间序列分析。本研究通过建立问题中常用的值函数和路径签名的有趣特性之间的联系,提出了一种称为签名控制的控制框架,能够高效地将贝尔曼方程推广到轨迹空间。我们分析该框架的特性和优势,证明了它能够自然处理变化 / 自适应时间步长,比值函数更新更高效地传播高级信息,并且对于长序列的动力系统误差建模具有稳健性。作为我们框架的一个具体案例,我们设计了一种适用于路径跟踪的模型预测控制方法。该方法推广了积分控制,适用于具有未知干扰的问题。我们在仿真环境中测试了所提出的算法,包括典型的控制和机器人任务,如点质量、蚂蚁模型的曲线跟踪和机器人操纵器。