Feb, 2023

连续时间延迟系统的神经拉普拉斯控制

TL;DR提出了一种基于神经拉普拉斯动态模型与模型预测控制理论相结合的离线学习算法,能够学习到具有固有未知延迟难以处理的实时反馈系统,实验证明其性能接近专家策略。