Dec, 2022
关联预测:面向强化学习任务无关的知识表示
Relate to Predict: Towards Task-Independent Knowledge Representations for Reinforcement Learning
Thomas Schnürer, Malte Probst, Horst-Michael Gross
TL;DR通过引入归纳偏置和语义模块,将观察空间分解为对象,并以语义表征和动态知识进一步分解,提高了模型的解释性和泛化性,且实验表明,知识分离的明确程度与学习速度、准确性和解释性相关。