Sep, 2022

存在干扰下的强化学习安全探索方法

TL;DR提出了一种安全探索方法,该方法利用受控对象和干扰的部分先前知识,以确保满足特定的状态约束条件,即使受控对象暴露于遵循正常分布的随机干扰下。