ICLRNov, 2017

路由网络:自适应选择非线性函数用于多任务学习

TL;DR本文提出了一种新的神经网络和训练算法 —— 路由网络(routing network),通过协同多智能体强化学习(collaborative multi-agent reinforcement learning)协同训练路由器(router)和功能块(function blocks),使得路由网络能够动态地组合不同的功能块以适应输入,从而在解决多任务学习(Multi-task learning)时大幅提升了准确性和收敛速度。