BriefGPT.xyz
Ask
alpha
关键词
misspecified case
搜索结果 - 2
针对向量 - 值正则化最小二乘算法的最佳 Sobolev 范数速率
我们提出了一个连续标准的无限维向量值岭回归问题的第一个最优率,在 $L_2$ 和假设空间之间插值的范数上,我们认为这是一个向量值再生核希尔伯特空间。这些率允许处理真实回归函数不包含在假设空间中的不正确情况。我们将假设空间的容量标准假设与一种
→
PDF
7 months ago
在线线性 $ q^π $ 可实现 MDPs 中的 RL 与线性 MDPs 一样简单,只要你学会忽略什么
在线强化学习中的线性可实现的马尔可夫决策过程 (MDP),提出了一种计算效率较低的学习算法,通过跳过特定状态转化为线性 MDP,并证明了该算法在这种情况下具有多项式样本复杂度。
PDF
9 months ago
Prev
Next