寻找决策树：通过搜索为黑箱系统合成决策树策略

Sep, 2024

寻找决策树：通过搜索为黑箱系统合成决策树策略

In Search of Trees: Decision-Tree Policy Synthesis for Black-Box Systems via Search

Emir Demirović, Christian Schilling, Anna Lukina

TL;DR本文针对决策树策略合成中面临的挑战，提出了一种新的搜索算法，能够在黑箱环境和指定条件下生成最优决策树策略。该方法通过一种新颖的剪枝机制，显著降低了搜索空间，确保了合成的决策树策略的最优性和有效性，具有重要的实践意义。

Abstract

Decision Trees, owing to their interpretability, are attractive as control policies for (dynamical) systems. Unfortunately, constructing, or synthesising, such policies is a challenging task. Previous approaches do so by imitating a neural-network policy, approximating a tabular policy

发现论文，激发创造

通过模型提取方法解释黑匣子模型

为了解释黑盒模型，本文提出使用决策树对其进行全局解释，并采用新的决策树提取算法避免过拟合，评估表明该方法正确率更高且可解释性更强。

May, 2017

强化学习引导下的程序合成树搜索

本文提出了一种新的程序合成方法，将寻找最优程序的问题转化为基于强化学习的马尔科夫决策过程，并将这种方法应用于浮点数RISC-V汇编语言的子集上，并结合基于搜索技术的优先搜索树，证明了我们的方法相较于其他基线方法的优越性

Jun, 2018

参数化分支定界搜索树以学习分支策略

采用参数化状态来帮助泛化“学习分支”方法，该方法可以有效地处理各种 MILP 问题，通过模拟学习框架实现新的输入特征和架构以表示分支决策，从而在准确性和B&B树的大小等方面具有显著的优势。

Feb, 2020

利用回溯轨迹的强化学习在分支定界优化中的应用

本文提出一种名为 retro branching 的强化学习方法，用于解决混合整数线性规划问题中的 branch-and-bound 算法中的变量选择问题，与之前的方法相比，本方法不需要专家指导或预训练，且在四种组合问题上表现优异。

May, 2022

马尔可夫决策过程的最优决策树策略

本文提出了一种优化方法，通过线性规划直接优化有限深度的决策树，使其在马尔科夫决策过程中达到最优性能，可用于解决强化学习策略可解释性的问题。通过实验证明，这种方法在性能和可解释性之间取得了平衡。

Jan, 2023

使用黑盒强化学习实现分类树的最佳可解释性与性能平衡

该论文研究了一种新的Reinforcement Learning (RL)框架，证明了只需要解决一个完全可观测的问题就能学习到一个优化可解释性-性能平衡的决策树。

Apr, 2023

TreeDQN：学习最小化分枝定界树

本文介绍了一种基于强化学习的组合优化问题解决方法，使用树马尔可夫决策过程视角选择变量分支，并且优化学习对象，相较之前的强化学习方法，训练数据量更小，生成树的大小更小。

Jun, 2023

行为树控制器的扩展收敛性结果

研究行为树的收敛性，包括广义的既有结果和文献中未涵盖的循环切换情况。

Aug, 2023

IBMDP中决策树策略学习的演员-评论算法的局限性

AI模型的可解释性使用户能够建立对这些AI的信任。我们展示了通过深度强化学习学习决策树的一个方法，从而通过透明地显示输入的关键特征来实现模型的解释性。

Sep, 2023

优化可解释决策树策略以实现强化学习

本研究解决了神经网络在强化学习中复杂性导致的可解释性问题，提出了一种新的算法DTPO，直接优化完整的决策树，以取代神经网络。通过使用回归的决策树启发式方法进行策略优化，实验证明DTPO在强化学习中对决策树策略的优化具有竞争力。

Aug, 2024