May, 2023

单智能体游戏中的策略提取

TL;DR本文提出了一种用行为策略作为可转移知识的方法进行知识转移的方法,定义了策略,并结合观察到的事件频率信息和局部序列对齐技术来提取策略,并在三种环境下得出了可行的策略,这是提取知识进行泛化和最终的转移学习的有希望的第一步。