将深度强化学习模型提炼成可解释的神经 - 模糊系统

Sep, 2022

将深度强化学习模型提炼成可解释的神经 - 模糊系统

Distilling Deep RL Models Into Interpretable Neuro-Fuzzy Systems

Arne Gevaert, Jonathan Peck, Yvan Saeys

TL;DR本文提出了一种使用深度强化学习中的策略来压缩神经模糊控制器的算法，该方法通过蒸馏将深度神经网络里的模型精华提取并转化成较小的规则库，可以在保持灵活性的同时，提升模型的可解释性。作者在 OpenAI Gym 上进行了测试，取得与深度强化学习相当的表现，但只需 2 至 6 条模糊规则。

Abstract

deep reinforcement learning uses a deep neural network to encode a policy, which achieves very good performance in a wide range of applications but is widely regarded as a black box model. A more interpretable al

deep reinforcement learning neuro-fuzzy controllers distillation policy interpretability

发现论文，激发创造

自动机蒸馏：神经符号转移学习用于深度强化学习

通过引入自动机蒸馏的形式的神经符号传递学习，以及静态传递和动态传递方法的使用，成功减少了找到各种决策任务的最佳策略所需的时间。

Oct, 2023

深度 Q 网络的更好可解释性

本文提出了一种可解释的神经网络架构，用于 Q-learning，在全局层面上使用键值记忆、注意力和可重构嵌入，提供模型行为的全局解释。使用有向探索策略，该模型可以达到与最先进的深度 Q-learning 模型相当的训练奖励，但结果表明该神经网络提取的特征非常浅，并且使用样本外的示例进行后续测试表明代理可以轻松地过拟合训练期间看到的轨迹。

Sep, 2018

策略蒸馏

本文介绍了一种称为 Policy Distillation 的新方法，它可以从强化学习代理中提取策略并训练出一个性能表现优异的、更小而且更高效的网络。同时，这种方法还可以将多个任务特定策略合并为一个策略并应用到 Atari 游戏中，在实验中，这个多任务提炼代理的表现要比单任务老师或联合训练的 DQN 代理更优秀。

Nov, 2015

神经逻辑强化学习

本文提出了一种名为神经逻辑强化学习（NLRL）的新算法，基于策略梯度方法和可微分归纳逻辑编程，通过一阶逻辑来表示强化学习中的策略，解决了深度神经网络难以解释和学习泛化能力低的问题。实验表明，该算法可以在不同的环境下归纳出解释性强且性能接近最优的策略。

Apr, 2019

具有可解释模型和策略网络的神经符号强化学习的三个路径

神经符号人工智能结合经典符号方法的可解释性、简洁性和显式推理与数据驱动神经方法的统计学习。本文在实际强化学习环境中展示了实现此类模型和策略的三个途径，并探讨了逻辑、模拟和学习的潜力和困难，以及与可学习性和可解释性之间的权衡关系。

Feb, 2024

深度强化学习驱动调度的可解释建模

通过使用可解释性强的决策树模型，我们提出了一个名为 IRL（可解释增强学习）的框架，用于解决深度强化学习在集群调度中缺乏可解释性的问题，并且证明了 IRL 可以在保持相似调度性能的同时将黑盒深度神经网络策略转化为可解释的基于规则的决策树。

Mar, 2024

一阶逻辑中的神经符号强化学习

为了在文本角色扮演游戏中实现快速收敛和可解释的知识表示，我们提出了一种新的基于逻辑神经网络的强化学习方法，该方法可以从文本观察中提取一阶逻辑事实并使用逻辑算子训练策略，实验结果表明该方法比其他基于神经元符号框架的方法更快收敛。

Oct, 2021

从神经网络中学习准确且可解释的决策规则集

本文提出了一种新的范式，使用一个可解释的二层神经网络学习一组独立的逻辑规则作为分类的模型，并提出一种基于稀疏性的规则得出算法，相比其他学习算法和黑匣子模型，该方法可以在分类准确性和简单性之间取得更好的平衡。

Mar, 2021

知识蒸馏提高深度神经网络的可解释性

使用知识蒸馏技术将深度神经网络转换成决策树，以同时实现较好的性能和可解释性，并比基准决策树模型获得显著更高的精度，在 TensorFlow 平台上实现对大数据集的可扩展性。

Dec, 2018

可解释化多智能体强化学习的概念学习

本文介绍了一种将领域专家的可解释概念纳入到多智能体强化学习模型中的方法，以提高模型的解释性和稳定性，提高性能和样本效率。

Feb, 2023