BriefGPT.xyz
Ask
alpha
关键词
dynamic depth routing
搜索结果 - 1
AAAI
不是所有任务都一样困难:具有动态深度路由的多任务强化学习
该研究通过动态深度路由(D2R)框架实现多任务强化学习,其中通过绕过中间模块灵活选择不同数量的模块来提高数据效率并解决不同策略的路由路径问题。该框架进一步引入 ResRouting 方法解决行为策略和目标策略在离策略训练过程中的差异路由路径
→
PDF
7 months ago
Prev
Next