BriefGPT.xyz
Ask
alpha
关键词
linear function approximation models
搜索结果 - 1
线性情境马尔可夫决策过程的样本复杂度刻画
该论文研究了上下文马尔可夫决策过程(CMDPs)在线性函数逼近模型下的性质,提出了创新的基于模型的算法,并证明了其在样本复杂度方面的优越性。比较两种模型的结果表明,上下文变化的特征比所有上下文共享表示在线性 CMDPs 中具有更好的样本效率
→
PDF
5 months ago
Prev
Next