Aug, 2021

使用线性函数逼近实现高效的本地规划

TL;DR研究使用线性函数逼近和模拟器的查询和计算高效的计划算法,在这种情况下,我们提出了名为 “Confident MC-LSPI” 和 “Confident MC-Politex” 的两种算法,同时证明了我们的算法在特征,有效规划控制范围和目标次优性的维度中具有多项查询和计算成本,而这些成本与状态空间的大小无关。