Apr, 2019

多任务软选项学习

TL;DR介绍了 Multitask Soft Option Learning (MSOL) 的一个层次化多任务框架,基于 Planning as Inference。使用单独的变分后验为每个任务提供正则化,并通过共享先验正则化实现。MSOL 通过避免训练过程中的不稳定性提供了软选项的概念,并为使用新任务的选项进行微调提供了自然方式,同时不会忘记其学习的策略。相比于分层和平面的迁移学习基线,MSOL 在实践中表现出更好的性能。