这篇论文提供了一种方法和开源实现,用于在包光网络场景中寻找最佳路径的强化学习算法。该算法利用物理层(前 FEC 误码率和传播延迟)和链路层(链路负载)提供的测量结果,配置基于延迟的奖励和惩罚集,然后基于这些测量结果执行 Q 学习,找到最佳的路由策略。进一步证明该算法通过根据链路负载变化或以前 FEC 误码率衡量的链路退化重新计算最佳策略,动态适应不断变化的网络条件。
Jun, 2024
本文提出了一种基于强化学习(RL)的无模型和数据驱动路径选择策略,结合图神经网络(GNN)的多智能体 RL 框架,探索了中央化,联合和合作学习三种部署范式,模拟结果表明该算法在分组传输延迟和负载方面优于一些现有的基准算法。
Jul, 2021
使用强化学习的路由算法能够控制拥塞和优化路径长度,从而提高网络吞吐量,有效地应用于复杂网络中各种流量场景和拓扑结构,并在实验中显示出最大节点拥塞减少 5 倍、效率提高 30% 的结果。
Dec, 2023
该研究论文重点研究了受到攻击的无人机网络的路由方案和恢复问题,通过设计基于节点重要性的攻击模型和节点重要性排名机制,利用基于强化学习的智能算法来处理当无人机受到攻击时的路由路径恢复问题,并通过模拟实验验证了该机制优于其他参考方法。
Aug, 2023
本研究主要探讨无线路由方案的优化,特别关注于集成接入回程(IAB)网络,旨在通过采取多智能体强化学习和马尔可夫决策过程等方法,最大化分组到达比率同时最小化网络延迟,并提升网络效率。在本研究中,我们提出了一种称为关系型优势演员评论家(Relational A2C)的算法,并对其进行了三种不同的训练范式。研究结果表明,相较于其他强化学习算法,该算法具有更好的性能和更低的个体自私行为,为 IAB 网络的路由策略优化提供了新的思路。
May, 2023
本文提出了一种可扩展的强化学习方法,用于同时路由和频谱访问无线自组网中的信号传输,根据邻居节点的地理位置信息智能地制定联合路由和频谱分配决策。
Dec, 2020
本研究基于多智能体深度强化学习设计了一种新的多播路由技术 DeepMPR,它在不需要邻居的多点中继广播信息的情况下,优于 OLSR MPR 选择算法,通过对比其他普及技术,展示了我们训练的 DeepMPR 多播转发策略的性能增益。
Jun, 2023
本文设计和评估了一个深度强化学习代理,该代理优化路由并自动适应当前交通条件,提出量身定制的配置以尝试最小化网络延迟,实验表现出极具潜力的性能与相较于传统优化算法的重要操作优势。
Sep, 2017
提出一种抵御干扰攻击的无线网络建模方案,通过干扰感知的路由协议和基于深度强化学习的分布式合作框架实现有效通讯以及网络安全防御,并优化吞吐量,能效,时延和安全指标。通过实验表明,提出的方案在对抗干扰攻击和实现优化吞吐量方面具有很好的鲁棒性和有效性。
Oct, 2019
本文提出了一种基于深度强化学习的全局路由方法,该方法可以在模拟环境中生成优化的路由策略,与传统的基于贪心算法的方法相比,该方法具有更高的灵活性和更优的效果,为未来数据驱动的路由方法的培训数据集和生成不同规模和约束条件的参数化全局路由问题集合提供了可能性。
Jun, 2019