BriefGPT.xyz
大模型
Ask
alpha
关键词
policy reuse framework
搜索结果 - 1
MM
未见流量场景下通信负载平衡的策略重用
本研究提出了一种基于强化学习的策略重用框架,通过在各种交通场景下训练和存储策略,并结合流量条件,选择最适合的预训练策略以更好地解决通信网络负载均衡问题。实验结果表明,这种方法比传统的基于规则和适应性方法表现更出色。
PDF
a year ago
Prev
Next