MMJun, 2022

可解释的序列优化的动态内存

TL;DR本论文提出了一种基于自适应贝叶斯学习的代理学习算法来解决强化学习中不稳定情况下的记忆流失问题,并通过统计假设检验实现了可解释性,表现良好。