Apr, 2023

神经网络控制器到决策树控制器的精确且具有成本效益的自动转换

TL;DR将基于神经网络的控制器转换为等效的软决策树控制器,以提高可验证性且减小意外行为的风险。在包含 ReLU 激活函数和 argmax 操作的离散输出 NN 控制器上,提出了一种自动剪枝的精确且高效的转换算法。以 OpenAI Gym 环境中的两个基准测试为例,结果表明 SDT 转换可以有助于形式验证,并显示其运行时在使用 MountainCar-v0 和 CartPole-v0 时分别提高了 21 倍和 2 倍。