深度 Q 网络的更好可解释性

AAAISep, 2018

Towards Better Interpretability in Deep Q-Networks

Raghuram Mandyam Annasamy, Katia Sycara

TL;DR本文提出了一种可解释的神经网络架构，用于 Q-learning，在全局层面上使用键值记忆、注意力和可重构嵌入，提供模型行为的全局解释。使用有向探索策略，该模型可以达到与最先进的深度 Q-learning 模型相当的训练奖励，但结果表明该神经网络提取的特征非常浅，并且使用样本外的示例进行后续测试表明代理可以轻松地过拟合训练期间看到的轨迹。

Abstract

deep reinforcement learning techniques have demonstrated superior performance in a wide variety of environments. As improvements in training algorithms continue at a brisk pace, theoretical or empirical studies on understanding what these networks seem to learn, are far behind. In this

deep reinforcement learning interpretable neural network architecture q-learning key-value memories attention

发现论文，激发创造

通过反向强化学习实现可解释的深度强化学习模型

本研究提出了一种新的框架，利用对抗性逆强化学习，可以为强化学习模型做出的决策提供全局解释，并通过总结模型的决策过程来捕捉直观的倾向。

Mar, 2022

深度学习的可视化可解释性调查

本文综述了解神经网络表示和学习可解释 / 解耦的中间层表示的最新研究进展，并重点介绍了卷积神经网络 (CNNs) 的可视化、诊断、解耦、学习及其在可解释人工智能方面的前景趋势。

Feb, 2018

揭开面纱：释放 Q 学习中的深度之力

通过统计学习理论的框架，我们理论上证实了深度 Q 学习在捕捉奖励的特殊属性上表现优秀，进而证明了深度 Q 学习优于传统 Q 学习的泛化误差边界，并在供应链管理中的知名啤酒游戏和模拟推荐系统中验证了我们的理论断言。

Oct, 2023

打破可解释深度学习的悖论

该研究提出了一种使用新方法训练的深度超网络来生成可解释的线性模型的方法，以保留黑匣子深度网络的准确性并提供自由的可解释性，而需要与黑匣子深度模型相同的运行时和内存资源，实现了实用性，实验结果表明，该可解释的深层网络在表格数据上与最先进的分类器一样准确，且在实际预测中也具有与最先进的解释技术相当的解释能力。

May, 2023

深度关注递归 Q 网络

通过深度强化学习方法，利用软、硬注意力机制的扩展 DQN 算法，以 Atari 游戏为测试模型，表明其性能优于 DQN，并且内置的注意机制使得可以直接监控训练过程。

Dec, 2015

用深度 Transformer Q 网络进行部分可观察强化学习

本文提出了一种基于 Transformer 和自注意力机制的全新架构 Deep Transformer Q-Networks（DTQN），可用于处理强化学习中的局部可见性、记忆和训练困难等问题，实验结果表明该模型相较于传统的循环神经网络方式在处理局部可视化任务时更加快速和稳定。

Jun, 2022

灰盒子：理解 DQNs

本文介绍了分析 Deep Q-networks（DQNs）的一种方法和工具，以及自动学习 Semi Aggregated Markov Decision Process（SAMDP）模型的算法。SAMDP 模型允许我们直接从特征中识别时空抽象，并且可以在今后的工作中用作子目标检测器。使用我们的工具，我们揭示了 DQNs 学习的特征以层次方式聚合状态空间，解释了其成功。此外，我们能够理解和描述 DQNs 为三个不同的 Atari2600 游戏学习的策略，并提出解释、调试和优化强化学习中深度神经网络的方式。

Feb, 2016

将深度强化学习模型提炼成可解释的神经 - 模糊系统

本文提出了一种使用深度强化学习中的策略来压缩神经模糊控制器的算法，该方法通过蒸馏将深度神经网络里的模型精华提取并转化成较小的规则库，可以在保持灵活性的同时，提升模型的可解释性。作者在 OpenAI Gym 上进行了测试，取得与深度强化学习相当的表现，但只需 2 至 6 条模糊规则。

Sep, 2022

关系深度强化学习

通过结构化感知和关系推理的方法，使用自我注意力来进行实体之间关系的迭代推理以及指导无模型策略的建立，提高了强化学习的效率、泛化能力和可解释性，并在 Box-World 任务和 StarCraft II Learning Environment 等方面取得了一定的进展。

Jun, 2018

使用情节记忆从深度强化学习生成解释

通过使用含有情节记忆系统的深度强化学习代理，识别和重述关键决策，生成人类可读的简短解释，可用于加快初学的无算法依赖深度强化学习代理的学习。

May, 2022