Apr, 2023

高维线性高斯模型的学习与集中:一种不变子空间方法

TL;DR研究了高维状态空间中的非渐近稳定性随机动力系统,通过采样子轨迹和利用Talagrand的不等式,证明了奖励的经验均值集中于稳态回报,探讨了系统的不变子空间之间的瓶颈现象以及及其对随机动力系统的学习和集中性的影响。