Sep, 2023

稀疏线性MDP中的探索和学习,无需计算难解的预测器

TL;DR线性马尔科夫决策过程(MDP)中的特征选择和零稀疏线性MDP,以及通过凸规划有效计算的模拟器、低深度决策树上的区块MDP的学习算法。