Dec, 2022

关联预测:面向强化学习任务无关的知识表示

TL;DR通过引入归纳偏置和语义模块,将观察空间分解为对象,并以语义表征和动态知识进一步分解,提高了模型的解释性和泛化性,且实验表明,知识分离的明确程度与学习速度、准确性和解释性相关。