Sep, 2023

稀疏线性 MDP 中的探索和学习,无需计算难解的预测器

TL;DR线性马尔科夫决策过程(MDP)中的特征选择和零稀疏线性 MDP,以及通过凸规划有效计算的模拟器、低深度决策树上的区块 MDP 的学习算法。