Jan, 2022

基于图形的可解释强化学习的两步混合策略学习

TL;DR本文提出了一种基于图形输入的两步式 RL 策略,透过实用化分类问题将决策过程分解为两个步骤并采用规则挖掘器进行推理,能够生成可解释和鲁棒的分层策略并在复杂文本游戏领域呈现出更好的泛化和稳健性。