Jun, 2012

一种基于Dantzig Selector的时序差分学习方法

TL;DR本文介绍了一种新的算法,通过将 LSTD 与 Dantzig Selector 结合,解决了 L1 正则化与 LSTD 整合的困难问题,该算法适用于高维问题。