Oct, 2023

高效且可解释的强化学习算法

TL;DR在现代机器学习中,我们设计了一种既高效又可解释的强盗算法来解释模型的重要性。通过引入一种新的不确定性损失度量标准,我们量化了可解释性,并通过基于约束的最优设计提出了 CODE 算法,它是可解释的且能最大程度地减少不确定性。我们通过数值实验在合成和真实世界问题上证明了 CODE 算法的优越性。