Jan, 2022

强化学习中的技能迁移:先验、层次和信息不对称性

TL;DR通过对不对称选择的研究,提出了分层强化学习和 KL 正则化在技能传递方面的潜力,实验和理论结果展示了技能传递和表达能力间的权衡,并提出了一种基于不对称选择的技能选择方法。