Feb, 2022

多任务学习中的模块化技能组合

TL;DR通过模块化设计并学习潜在的离散技能,该研究在多任务强化学习和少样本学习中实现了更高的样本效率和解释性。