Nov, 2022

强化学习中的知识迁移无效行为学习

TL;DR该研究提出了一种系统性的方法来将先验知识引入强化学习算法中,试图通过学习无关的行为来降低样本复杂性,并通过实验证明了其可以提高算法的样本效率和转移学习能力。