Jun, 2011

使用递归最小二乘法的高效强化学习

TL;DR本文提出和分析了两种基于RLS方法的强化学习算法, 即RLS-TD(lambda)和Fast-AHC, 利用这些算法可以提高学习预测和学习控制的数据效率。