Nov, 2020

神经网络策略中实施鲁棒控制保证

TL;DR通过将人工神经网络用于构建通用非线性控制策略并结合凸优化投影层,本论文提出了一种能在保持鲁棒性的同时提高控制系统的平均性能的技术,同时在非鲁棒的深度强化学习(deep RL)方法的最坏情况稳定性方面也有所提高。