Jun, 2020

基于深度强化学习的实时模型校准

TL;DR本研究提出了一种基于强化学习的模型参数推断框架,该框架以物理模型响应跟踪为目标,利用一种约束Lyapunov 基础的 actor-critic (CLAC) 算法,考虑了大规模和高维数据以及嘈杂的真实世界条件下的鲁棒性,实现了在两个基于物理模型的诊断测试案例中的优秀表现。