Jan, 2025

神经DNF-MT:一种用于学习可解释和可编辑策略的神经符号方法

TL;DR本研究解决了深度强化学习中的策略可解释性问题,提出了一种名为神经DNF-MT的新型神经符号方法,能够实现端到端的策略学习。通过将模型训练与标准逻辑程序相结合,研究展示了如何将确定性政策的双值表示进行编辑,并将其融入神经模型中,从而实现对所学习策略的手动干预和适应。