亲和力基础强化学习代理的马尔科夫模型符号解释

Aug, 2022

亲和力基础强化学习代理的马尔科夫模型符号解释

Symbolic Explanation of Affinity-Based Reinforcement Learning Agents with Markov Models

Charl Maree, Christian W. Omlin

TL;DR为了改善现有强化学习算法的透明度不足，研究人员开发了一种策略正则化方法，使用离散化马尔可夫模型的全局代理来复现基于个人消费行为的投资策略，并提出了一种针对这些策略全局内在亲和性的解释方法，以实现对策略行为的推理，从而提高其可解释性。

Abstract

The proliferation of artificial intelligence is increasingly dependent on model understanding. Understanding demands both an interpretation - a human reasoning about a model's behavior - and an explanation - a sy

artificial intelligence model understanding policy regularization method personalized prosperity management markov models

发现论文，激发创造

通过模型转换的可解释强化学习

通过使用形式化的马尔科夫决策过程抽象和转换，以自动产生解释的方式，解释强化学习智能体的新兴行为。

Sep, 2022

可解释化多智能体强化学习的概念学习

本文介绍了一种将领域专家的可解释概念纳入到多智能体强化学习模型中的方法，以提高模型的解释性和稳定性，提高性能和样本效率。

Feb, 2023

通过策略规范化对智能体进行特征化的强化学习

该论文提出了一种基于正则化的强化学习方法，使代理人的行为具有指定的特征，从而增强了透明度和可解释性，并可应用于金融领域的个性化投资组合优化。

Jan, 2022

通过技能多样性利用近似符号模型进行强化学习

本文介绍了近似符号模型引导的强化学习方法，该方法将字符的建模与底层措施相结合，以在不完整的符号模型信息下发现任务结构并有效地引导强化学习智能体向目标靠拢。

Feb, 2022

具有可解释模型和策略网络的神经符号强化学习的三个路径

神经符号人工智能结合经典符号方法的可解释性、简洁性和显式推理与数据驱动神经方法的统计学习。本文在实际强化学习环境中展示了实现此类模型和策略的三个途径，并探讨了逻辑、模拟和学习的潜力和困难，以及与可学习性和可解释性之间的权衡关系。

Feb, 2024

面向符号自动机编码目标的无模型强化学习

本文提出使用符号自动机的形式规范，来代替马尔可夫奖励，并定义了使用潜在奖励的策略，来提高强化学习的收敛性。

Feb, 2022

利用内在亲和力进行个性化繁荣管理的强化学习

本研究开发了一种正则化方法，以确保策略具有全局内在亲和力，并利用这些内在策略亲和力使我们的强化学习模型具有内在可解释性。我们展示了如何训练 RL agents 来编排特定个性类型的个体策略，并仍然获得高回报。

Apr, 2022

基于状态转移模型的基于特征的可解释强化学习

提出了一种基于状态转移模型的强化学习局部可解释风险的方法，并通过实验证明了其有效性。

May, 2021

学习符号表示以实现非马尔可夫行为的强化学习

利用知识表示和自动机结构，本文提出了一种自动发现有用状态抽象的端对端算法，用于学习非 Markov 领域下优化策略，相较于最先进的强化学习算法，能够在更少的环境样本下得到更优的结果。

Jan, 2023

强化学习代理策略理解与可视化框架

本研究提出了一个框架，用于学习顺序决策任务的可理解模型，通过时间逻辑公式表征代理策略，并使用一个嵌入方法对代理足迹进行聚类，得出在不同的聚类中解释代理策略的逻辑公式，通过编写一个特征提取器和一个可视化工具，对在 StarCraft II 中的战斗场景进行了评估，实验结果表明，本框架可以将代理足迹分为不同的行为组，并为每个行为组提供一致、有意义且易于理解的策略描述。

Aug, 2022