May, 2023

稀疏提示下元策略网络中的持续任务分配

TL;DR本文提出了Continual Task Allocation via Sparse Prompting(CoTASP)方法,通过在训练过程中学习过度完备的词典生成稀疏掩模,并通过不断优化互相调整以更新元策略,从而解决了强化学习中新任务训练效率低问题,最终在各项任务和泛化性上表现优异。