Dec, 2022

理解强化学习中的自预测学习

TL;DR本篇研究探讨了自预测学习的学习动态,通过对优化动态的设计,提出了双向自学习算法,并通过一系列实验验证了该算法的有效性。