路由网络：自适应选择非线性函数用于多任务学习

ICLRNov, 2017

路由网络：自适应选择非线性函数用于多任务学习

Routing Networks: Adaptive Selection of Non-linear Functions for Multi-Task Learning

Clemens Rosenbaum, Tim Klinger, Matthew Riemer

TL;DR本文提出了一种新的神经网络和训练算法 —— 路由网络（routing network），通过协同多智能体强化学习（collaborative multi-agent reinforcement learning）协同训练路由器（router）和功能块（function blocks），使得路由网络能够动态地组合不同的功能块以适应输入，从而在解决多任务学习（Multi-task learning）时大幅提升了准确性和收敛速度。

Abstract

multi-task learning (MTL) with neural networks leverages commonalities in tasks to improve performance, but often suffers from task interference which reduces the benefits of transfer. To address this issue we introduce the →

multi-task learning neural network routing network function blocks collaborative multi-agent reinforcement learning

发现论文，激发创造

任务路由的多任务学习

本文提出一种名为任务路由的多任务学习方法，应用于卷积层激活上的条件特征转换，实现更高效的多任务训练，在单个模型中成功适配了数百个分类任务，并在 5 个数据集上验证了其性能。

Mar, 2019

基于协同训练的路由网络持续学习

使用稀疏路由网络和共同训练来提高不断学习的性能，其最终可以超过基于全连接网络的性能。

Sep, 2020

决定如何决策：人工神经网络中的动态路由

我们提出并系统评估了三种训练动态路由人工神经网络的策略：通过学习变换的图形，不同的输入信号可以采取不同的路线。我们发现，在训练用于分类图像的动态路由网络中，层和分支变得专门处理不同类别的图像。此外，给定固定的计算预算，动态路由网络往往比可比的静态路由网络表现更好。

Mar, 2017

基于图注意力多智能体强化学习的分组路由

本文提出了一种基于强化学习（RL）的无模型和数据驱动路径选择策略，结合图神经网络（GNN）的多智能体 RL 框架，探索了中央化，联合和合作学习三种部署范式，模拟结果表明该算法在分组传输延迟和负载方面优于一些现有的基准算法。

Jul, 2021

深度强化学习遇见图神经网络：探索一种路由优化用例

本篇论文提出在 Deep Reinforcement Learning 技术中，将 Graph Neural Networks 集成进 DRL 代理中，以解决网络拓扑的泛化问题，并在路由优化的用例中测试并评估其性能，结果表明，在未曾训练过的网络拓扑中，DRL+GNN 代理能够胜过目前最先进的解决方案。

Oct, 2019

不是所有任务都一样困难：具有动态深度路由的多任务强化学习

该研究通过动态深度路由（D2R）框架实现多任务强化学习，其中通过绕过中间模块灵活选择不同数量的模块来提高数据效率并解决不同策略的路由路径问题。该框架进一步引入 ResRouting 方法解决行为策略和目标策略在离策略训练过程中的差异路由路径问题，并设计了自动的路由平衡机制来促进未掌握任务的继续路由探索。在 Meta-World 基准测试中，通过该框架在各种机器人操作任务上进行了广泛实验，取得了具有显著提高的学习效率的最新成果。

Dec, 2023

软模块化的多任务强化学习

通过引入显式的模块化技术和路由网络，将多任务共享的参数进行重新配置，实现了适用于连续任务的软模块化方法，从而大幅提高了机器人操作任务的效率和性能。

Mar, 2020

通过非可学习的基元进行显式任务路由来缓解多任务学习中的任务干扰

ETR-NLP 通过非可学习的原始提取多样的任务无关特征并将其重新组合到一个共享分支和各个任务的显式分支中，以减少任务干扰，实验证明 ETR-NLP 在所有数据集上用更少的可学习参数和类似的操作数（FLOPs）显著优于最先进的基线模型。

Aug, 2023

路由网络与模块化、组合计算的挑战

本文研究细致分析了组合学习中需要同时学习模块参数和它们的组合时所面临的挑战并探索了一种名为路由网络的解决方案，考察了该算法在模块组合决策、模块更新和正则化方面对结果的影响。

Apr, 2019

综合接入回传网络的多智能体强化学习网络路由

本研究主要探讨无线路由方案的优化，特别关注于集成接入回程（IAB）网络，旨在通过采取多智能体强化学习和马尔可夫决策过程等方法，最大化分组到达比率同时最小化网络延迟，并提升网络效率。在本研究中，我们提出了一种称为关系型优势演员评论家（Relational A2C）的算法，并对其进行了三种不同的训练范式。研究结果表明，相较于其他强化学习算法，该算法具有更好的性能和更低的个体自私行为，为 IAB 网络的路由策略优化提供了新的思路。

May, 2023