Nov, 2024

利用轨迹解释强化学习决策:可重复性研究

TL;DR本研究解决了“利用轨迹解释强化学习决策”论文的可重复性问题。我们验证该论文中关于轨迹聚类与强化学习代理决策之间关系的主要论点,并在定量方面进行了扩展,发现部分结论是可支持的,同时强调需要进一步的研究以增强现有结果的坚实基础。此项工作为未来更加清晰和透明的解释性强化学习方法铺平了道路。