AAAIMar, 2023

面向语言条件任务的概念强化学习

TL;DR本研究提出了一种概念强化学习 (CRL) 框架,通过多级注意力编码器和两个互信息约束来提高语言条件策略的训练效率和泛化能力,该框架提取了一种类似于人类认知的紧凑且不变的联合表示。