BriefGPT.xyz
Aug, 2021
使用线性函数逼近实现高效的本地规划
Efficient Local Planning with Linear Function Approximation
HTML
PDF
Dong Yin, Botao Hao, Yasin Abbasi-Yadkori, Nevena Lazić, Csaba Szepesvári
TL;DR
研究使用线性函数逼近和模拟器的查询和计算高效的计划算法,在这种情况下,我们提出了名为“Confident MC-LSPI”和“Confident MC-Politex”的两种算法,同时证明了我们的算法在特征,有效规划控制范围和目标次优性的维度中具有多项查询和计算成本,而这些成本与状态空间的大小无关。
Abstract
We study query and computationally efficient planning algorithms with
linear function approximation
and a
simulator
. We assume that the agent only has local access to the
→