可微分决策树是否能够学习可解释的奖励函数？

Jun, 2023

可微分决策树是否能够学习可解释的奖励函数？

Can Differentiable Decision Trees Learn Interpretable Reward Functions?

Akansha Kalra, Daniel S. Brown

TL;DR使用 Differentiable Decision Trees 学习可解释的奖励函数，研究表明其能够学习可解释的奖励函数，但树的离散性会降低强化学习的性能。

Abstract

There is an increasing interest in learning reward functions that model human intent and human preferences. However, many frameworks use blackbox learning methods that, while expressive, are difficult to interpre

reward functions human preferences interpretable differentiable decision trees cartpole

发现论文，激发创造

用树实现奖励学习：方法和评估

本文探讨了使用可读性更好的树模型进行奖励函数生成的优势，并通过实验证明其在高维复杂任务上具有与神经网络同等的有效性与鲁棒性，并展示其可追溯性、验证性和可解释性。

Oct, 2022

使用黑盒强化学习实现分类树的最佳可解释性与性能平衡

该论文研究了一种新的 Reinforcement Learning (RL) 框架，证明了只需要解决一个完全可观测的问题就能学习到一个优化可解释性 - 性能平衡的决策树。

Apr, 2023

IBMDP 中决策树策略学习的演员 - 评论算法的局限性

AI 模型的可解释性使用户能够建立对这些 AI 的信任。我们展示了通过深度强化学习学习决策树的一个方法，从而通过透明地显示输入的关键特征来实现模型的解释性。

Sep, 2023

用动态规划发现决策树的解释性与性能的最优解

为了找到最佳的决策树，本文提出了一种新的马尔可夫决策问题 (MDP) 的公式，允许用户在计算一个动态规划的同时选择最适合自身需求的决策树

Sep, 2023

决策树的优质多样进化学习

为了解释机器学习的需求，在解释性人工智能研究方向上，决策树和增强学习的混合模型成为一个新的研究方向，其中使用了 MAP-Elites 方法来拓展模型，该方法在 OpenAI Gym 库的两个控制问题中表现良好。

Aug, 2022

深度神经决策树

本研究提出了 Deep Neural Decision Trees（DNDT）—— 由神经网络实现的树模型，可以用于处理表格数据，DNDT 具有自解释性和自剪枝功能。

Jun, 2018

马尔可夫决策过程的最优决策树策略

本文提出了一种优化方法，通过线性规划直接优化有限深度的决策树，使其在马尔科夫决策过程中达到最优性能，可用于解决强化学习策略可解释性的问题。通过实验证明，这种方法在性能和可解释性之间取得了平衡。

Jan, 2023

Distill2Explain: 可解释的强化学习能源应用控制器中可微分的决策树

提出了一种使用可解释的决策树来训练数据驱动型控制策略的新方法，用于解锁居住部门在能源灵活性方面的潜力，并展示其在家庭能源管理系统中降低能源成本方面优于基准策略的性能和可解释性。

Mar, 2024

深度强化学习驱动调度的可解释建模

通过使用可解释性强的决策树模型，我们提出了一个名为 IRL（可解释增强学习）的框架，用于解决深度强化学习在集群调度中缺乏可解释性的问题，并且证明了 IRL 可以在保持相似调度性能的同时将黑盒深度神经网络策略转化为可解释的基于规则的决策树。

Mar, 2024

解释决策树

该研究提出了一种计算 DT 的极小解释集 PI-explanations 的新模型，该模型可在多项式时间内计算一个 PI-explanation，并将枚举 PI-explanations 减少到枚举最小击中集的数量。实验结果表明，在大多数情况下，DT 的路径是 PI-explanations 的子集。

Oct, 2020