Feb, 2024

强化学习中可解释性的抽象轨迹可视化

TL;DR解释性人工智能(XAI)可以帮助研究强化学习(RL)模型如何工作的 RL 从业者,但对于没有 RL 专业知识的用户(非 RL 专家)的 XAI 研究不够充分。我们认为,描述 RL 模型主要状态之间转换的抽象轨迹对于非 RL 专家构建对代理模型的心理模型很有用。我们的早期结果表明,通过利用抽象轨迹的可视化,没有 RL 专业知识的用户能够推断 RL 的行为模式。