Mar, 2018

随机控制中对错误系统模型的鲁棒性

TL;DR研究离散时间随机控制问题的连续性特性和最优控制策略的鲁棒性,在考虑测量模型及转移核函数的连续性等条件下,证明了最优成本可在弱收敛下实现连续性,且总变异下的预计诱发成本是鲁棒的,对基于经验学习的随机控制领域有积极意义。