Nov, 2020

具有低秩转换的情节线性二次调节器

TL;DR本篇论文提出一种基于系统内在低秩结构进行高效学习的算法,使样本复杂度只依赖于秩而非环境维度,同时获得了关于 K 的次线性复杂度,在 LQR 问题的应用中取得了较好效果。