Jun, 2024

REVEAL-IT: 可解释性的具备进化 Agent 策略的增强学习

TL;DR在本文中,我们提出了 REVEAL-IT 框架,用于解释复杂环境中代理人的学习过程。我们通过可视化策略结构和代理人在各种训练任务中的学习过程来理解一个特定的训练任务或阶段对代理人在测试中的性能有多大影响。然后,基于图神经网络的解释器学习突出策略中最重要的部分,提供更清晰和更强大的解释代理人学习过程的工具。实验证明,从该框架获得的解释能够有效帮助优化。