Jun, 2024

基于强化学习的分组光网络路由与混合遥测

TL;DR这篇论文提供了一种方法和开源实现,用于在包光网络场景中寻找最佳路径的强化学习算法。该算法利用物理层(前 FEC 误码率和传播延迟)和链路层(链路负载)提供的测量结果,配置基于延迟的奖励和惩罚集,然后基于这些测量结果执行 Q 学习,找到最佳的路由策略。进一步证明该算法通过根据链路负载变化或以前 FEC 误码率衡量的链路退化重新计算最佳策略,动态适应不断变化的网络条件。