强化学习策略总结的布尔决策规则

Jul, 2022

强化学习策略总结的布尔决策规则

Boolean Decision Rules for Reinforcement Learning Policy Summarisation

James McCarthy, Rahul Nair, Elizabeth Daly, Radu Marinescu, Ivana Dusparic

TL;DR该研究提出使用布尔决策规则模型来创建一个后续的基于规则的摘要，从而使强化学习策略可解释；实验结果显示该方法可以用于基于网格世界的 DQN 代理训练并创建简单的规则总结，同时也探讨了其在安全控制和调试 RL 代理时的潜在应用。

Abstract

explainability of reinforcement learning (RL) policies remains a challenging research problem, particularly when considering RL in a safety

reinforcement learning safety explainability boolean decision rules debugging

发现论文，激发创造

基于状态转移模型的基于特征的可解释强化学习

提出了一种基于状态转移模型的强化学习局部可解释风险的方法，并通过实验证明了其有效性。

May, 2021

强化学习中的保护进展：用于控制策略合成的安全贝叶斯探索

这篇论文研究了在强化学习过程中如何保证训练的安全性，通过提出一种新的架构处理效率和安全性之间的权衡，并利用贝叶斯推理和马尔可夫决策过程来近似风险，并通过实验结果展示了整体架构的性能。

Dec, 2023

知识表示与推理的强化学习：简要综述

该文综述了利用知识表示与推理方法在强化学习中更抽象表现和更有效学习的领域中取得的进展和应用，并讨论了未来在此领域中需要解决的挑战和可能的方向。

Apr, 2023

可解释的、基于模型的层级安全强化学习框架

该论文提出了一种将深度强化学习与概率建模和决策策略相结合的新方法（BC-SRLA），该方法在安全关键系统中具有优越性能，并且在维护领域的案例研究中展示出了比先前技术和其他基准更好的表现。

Oct, 2023

生成强化学习策略解释的实证研究

本文介绍了一组用于政策解释的线性时态逻辑公式，重点是通过这些公式解释政策所实现的最终目标和执行过程中的先决条件。这些基于线性时态逻辑的解释具有结构化表示，特别适用于局部搜索技术。通过模拟夺旗环境显示了我们提出的方法的有效性。最后，提出了未来研究的方向。

Sep, 2023

强化学习代理策略理解与可视化框架

本研究提出了一个框架，用于学习顺序决策任务的可理解模型，通过时间逻辑公式表征代理策略，并使用一个嵌入方法对代理足迹进行聚类，得出在不同的聚类中解释代理策略的逻辑公式，通过编写一个特征提取器和一个可视化工具，对在 StarCraft II 中的战斗场景进行了评估，实验结果表明，本框架可以将代理足迹分为不同的行为组，并为每个行为组提供一致、有意义且易于理解的策略描述。

Aug, 2022

多智能体强化学习的策略解释

本文介绍了针对多智能体强化学习提出两种方法生成策略解释的手段：关于智能体协作和任务序列的策略总结和回答智能体行为问题的语言解释。在三个多智能体应用领域的实验结果及用户研究中，表明了该方法的可扩展性和显著提高了使用者满意度和性能评价结果。

Apr, 2022

基于预期后果的强化学习对比解释

本文提出了一种方法，使强化学习代理能够解释其行为，以期实现机器学习模型的透明化。通过将状态和行动转换为易于人类理解的描述，并使用一种可生成解释的格式，进行了计算，结果表明人类用户倾向于关注政策而非单个操作。

Jul, 2018

基于安全强化学习的可证明交通规则遵守在开放海域中的应用

自动驾驶车辆必须遵守交通规则，为了解决使用基于优化的运动规划器解决的时间逻辑约束难题，我们提出了一种基于增强学习的可靠安全的方法来遵守交通规则，并以船只在开放海域中遵循《海上避碰规则公约》（COLREGS）为实际应用领域，我们引入了一种高效的验证方法来确定行动是否符合使用时间逻辑形式化的 COLREGS，从而我们的行动验证被整合到增强学习过程中，使代理只选择被验证过的行动。与仅将交通规则信息整合到奖励函数中的代理相比，我们的可靠安全代理在关键的海上交通情况中始终遵守形式化规则，从而不会导致碰撞。

Feb, 2024

深度强化学习在全局策略下用于基于查询的提取式摘要

本文提出一种应用基于策略梯度算法的深度强化学习系统的证明性方法，以解决文本摘要中标签不匹配问题，使用无折扣奖励学习具有简单神经网络和简单特征的策略，验证结果表明在全局策略下具有鼓舞人心的表现。

Nov, 2017