Jun, 2023

可微分决策树是否能够学习可解释的奖励函数?

TL;DR使用 Differentiable Decision Trees 学习可解释的奖励函数,研究表明其能够学习可解释的奖励函数,但树的离散性会降低强化学习的性能。