Vizarel: 一个辅助更好理解强化学习代理的系统

ICMLJul, 2020

Vizarel: 一个辅助更好理解强化学习代理的系统

Vizarel: A System to Help Better Understand RL Agents

Shuby Deshpande, Jeff Schneider

TL;DR本文介绍了一种可解释的增强学习平台，通过可视化工具对监督学习和增强学习进行可视化，试图提高对模型成功和失败的理解和洞察力，并为人们提供了实验的机会。

Abstract

visualization tools for supervised learning have allowed users to interpret, introspect, and gain intuition for the successes and failures of their models. While →

visualization tools supervised learning reinforcement learning interpretable experiment

发现论文，激发创造

RL 交互式调试的可视化

本研究设计和实现了一种交互式可视化工具，用于调试和解释强化学习算法，解决了现有工具在强化学习环境下不适用的问题。

Aug, 2020

社会可解释性强化学习

基于社会学习原理的 Social Interpretable RL (SIRL) 是一种改善学习效率的新型基于人口的方法，通过模拟社会学习过程使每个群体中的智能体基于自身的个体经验和与同伴的共同经验来解决给定任务，实现了在高风险场景中解释能力关键的强化学习应用。

Jan, 2024

可解释化多智能体强化学习的概念学习

本文介绍了一种将领域专家的可解释概念纳入到多智能体强化学习模型中的方法，以提高模型的解释性和稳定性，提高性能和样本效率。

Feb, 2023

一项关于自适应系统可解释的在线强化学习的用户研究

在线强化学习和深度强化学习在自适应系统和可解释性 RL 技术方面的实际应用以及用户研究。

Jul, 2023

可解释强化学习：调查

该论文对可解释强化学习方法进行了归类和评估，并发现大多数方法是通过模仿和简化复杂模型而非设计本质简单模型来实现目的的，缺乏人文思考和跨学科研究。因此需要进行一系列的跨学科努力才能将这些生成的解释改进为非专家用户易于理解的形式，以实现可解释人工智能的最终目标。

May, 2020

可解释性强化学习综述：概念、算法、挑战

本篇综述论文将积极介绍深度强化学习与可解释机器学习的交叉，比较了先前的方法，提出了一种补充，阐明了深度学习对智能机器人控制任务的适用性，强调机器学习与人类知识相互融合提升学习效率和性能的意义，并评估了未来 XRL 研究面临的挑战和机遇。

Nov, 2022

利用解释性技术实现强化学习模型的保证

通过使用 ARLIN 工具包，本文介绍了一种基于可解释强化学习（XRL）的方法，通过提供人类可解释的输出，帮助识别培训过的深度强化学习（DRL）模型中的潜在漏洞和关键问题，以增加用户在实际应用中的信任和采用。

Nov, 2023

VIREL：一种变分推断框架的强化学习

提出一种新的基于概率模型的强化学习方法 VIREL，通过应用参数化的动作值函数来总结底层 MDP 系统的未来动态，使 VIREL 具有 KL 散度的寻找峰值形式、自然地从推断中学习确定性最佳策略的能力和分别优化价值函数和策略的能力。通过对 VIREL 应用变分期望最大化方法，我们表明可以将 Actor-critic 算法简化为期望最大化，其中策略改进对应 E 步骤，策略评估对应 M 步骤，最后，我们展示了来自这个家族的 Actor-critic 算法在几个领域优于基于软值函数的最新方法。

Nov, 2018

强化学习中可解释性的抽象轨迹可视化

解释性人工智能（XAI）可以帮助研究强化学习（RL）模型如何工作的 RL 从业者，但对于没有 RL 专业知识的用户（非 RL 专家）的 XAI 研究不够充分。我们认为，描述 RL 模型主要状态之间转换的抽象轨迹对于非 RL 专家构建对代理模型的心理模型很有用。我们的早期结果表明，通过利用抽象轨迹的可视化，没有 RL 专业知识的用户能够推断 RL 的行为模式。

Feb, 2024

让凡人理解强化学习：一项经验研究

本研究通过用户研究，探究关于解释对非专家理解强化学习代理的影响，研究了视觉化 saliency 和最近的解释类型奖励分解条，并设计了实验以比较参与者对于简单实时战略游戏中 RL 代理的心理模型。结果表明，需要同时结合 saliency 和奖励条才能显著提高心理模型得分。

Mar, 2019