Sep, 2016

学习针对重复操作系统的个性化最优控制

TL;DR此研究讨论在参数不确定性的情况下,以在线学习的方法针对连续操作系统进行最优控制,在考虑随机性因素的情况下,设计了一种能够个性化控制输入的智能体,并在模拟系统上验证了算法的有效性。