Nov, 2022

一种强化学习的方法优化可用网络带宽利用

TL;DR本文提出了一种利用深度强化学习的方法来寻找最适宜的并行 TCP 流数量,以使网络带宽得到合理利用,并确保在争用传输之间的公平性。与规则和贪心算法相比,我们的 RL 算法可以在未知网络情况下动态发现和使并行 TCP 流适应不同的网络环境。研究证明,我们的算法可以更快地找到接近最优的解决方案,同时提高达 15% 的吞吐量,并避免网络拥塞和资源浪费。