Jun, 2023

主动查询的马尔科夫形式

TL;DR我们综述了近期人工智能领域中积极学习算法的研究现状,并提出了一种基于马尔可夫模型的形式化方法来组织该领域的研究。我们将提出的形式化方法应用于数据集增强,奖励更新等积极学习过程的元状态转移,以及针对其它方面如何适应形式化方法。