BriefGPT.xyz
Ask
alpha
关键词
routing network
搜索结果 - 4
AAAI
不是所有任务都一样困难:具有动态深度路由的多任务强化学习
该研究通过动态深度路由(D2R)框架实现多任务强化学习,其中通过绕过中间模块灵活选择不同数量的模块来提高数据效率并解决不同策略的路由路径问题。该框架进一步引入 ResRouting 方法解决行为策略和目标策略在离策略训练过程中的差异路由路径
→
PDF
6 months ago
MoEC: 专家混合聚类
本研究提出了 Mixture of Expert Clusters 模型,通过在路由阶段引入基于方差的约束来促进专家层学习更多不同和适当的知识,并提出了一种专家集群结构的集群级别专家丢失策略。实验证明,该模型可以提高机器翻译和自然语言理解任
→
PDF
2 years ago
软模块化的多任务强化学习
通过引入显式的模块化技术和路由网络,将多任务共享的参数进行重新配置,实现了适用于连续任务的软模块化方法,从而大幅提高了机器人操作任务的效率和性能。
PDF
4 years ago
ICLR
路由网络:自适应选择非线性函数用于多任务学习
本文提出了一种新的神经网络和训练算法 —— 路由网络(routing network),通过协同多智能体强化学习(collaborative multi-agent reinforcement learning)协同训练路由器(router
→
PDF
7 years ago
Prev
Next