BriefGPT.xyz
Ask
alpha
关键词
lstd
搜索结果 - 3
IJCAI
增量式截断最小二乘法
本文介绍了一种低秩 LSTD 算法,该算法能更好地平衡计算效率和采样效率,使过去的样本高效地实现对最少二乘法时间差分(LSTD)的采样复杂度,同时实现近似 LSTD 的样本复杂度。我们在模拟中给出了关于截断低秩逼近所得解的模拟界限,这表明一
→
PDF
9 years ago
LSTD ($λ$) 的收敛速率和误差界
本文考虑 LSTD (λ) 算法,推导出了任意 λ 及 β-mixing 条件下该算法收敛速率的高概率估计及误差的高概率界,探究了 λ 值选择对线性空间质量和样本数的影响。
PDF
10 years ago
ICML
一种基于 Dantzig Selector 的时序差分学习方法
本文介绍了一种新的算法,通过将 LSTD 与 Dantzig Selector 结合,解决了 L1 正则化与 LSTD 整合的困难问题,该算法适用于高维问题。
PDF
12 years ago
Prev
Next