May, 2024

RICE: 强化学习训练突破瓶颈的解释方法

TL;DR我们提出了一种创新的强化学习改进方案RICE,该方案通过结合默认初始状态和通过解释方法确定的关键状态构建新的初始状态分布,以鼓励智能体从混合的初始状态进行探索,理论上保证了改进方案具有更紧密的次最优性限制,评估结果表明RICE在增强智能体性能方面显著优于现有的改进方案。