ICMLMay, 2010

基于正则化的特征选择在近似线性规划中用于 Markov 决策过程

TL;DR本文介绍了使用 $L_1$ 正则化方法的近似线性规划,以解决过多和丰富的特征对现有算法的过拟合问题,并为正则化的近似线性规划提供新的和更强的采样上界;并提出了计算有效的同伦方法。在简单的 MDPs 和基准问题上,提出的方法表现良好。