Oct, 2023

结合行为和继承特征键盘

TL;DR使用最新提出的 “Option Keyboard”(OK) 方法,本研究提出了 “Successor Features Keyboard”(SFK) 和 “Categorical Successor Feature Approximator”(CSFA) 两种方法,实现在一个具有挑战性的三维环境中,通过发现状态特征和任务编码进行知识迁移。通过对比其他方法和基准的实验结果,结果显示 CSFA 能够以更高效的方式进行 SF 近似,并且 SFK 在长期任务中最快地进行知识迁移。