May, 2022

针对少样本任务概括的快速推理和组合任务结构转移

TL;DR本研究提出基于多任务子任务图推断的少样本强化学习方法,通过推断训练任务的高层子任务图结构,提高在测试任务中的任务推断和适应能力,实验结果表明其能够学习并利用任务的潜在共同结构,比其他现有算法如元强化学习、分层强化学习和启发式智能体等更快地适应未见过的任务。