Jun, 2023

从只包含状态序列中学习非 Markov 决策制定

TL;DR本文研究了一种在非 Markov 决策过程下进行深度生成建模的模型,在无法观察到动作的情况下进行模仿学习和决策制定。