一种强化学习的方法优化可用网络带宽利用

Nov, 2022

一种强化学习的方法优化可用网络带宽利用

A Reinforcement Learning Approach to Optimize Available Network Bandwidth Utilization

Hasibul Jamil, Elvis Rodrigues, Jacob Goldverg, Tevfik Kosar

TL;DR本文提出了一种利用深度强化学习的方法来寻找最适宜的并行 TCP 流数量，以使网络带宽得到合理利用，并确保在争用传输之间的公平性。与规则和贪心算法相比，我们的 RL 算法可以在未知网络情况下动态发现和使并行 TCP 流适应不同的网络环境。研究证明，我们的算法可以更快地找到接近最优的解决方案，同时提高达 15% 的吞吐量，并避免网络拥塞和资源浪费。

Abstract

Efficient data transfers over high-speed, long-distance shared networks require proper utilization of available network bandwidth. Using parallel TCP streams enables an application to utilize network parallelism and can improve transfer throughput; however, finding the optimum number of parallel TCP streams is challenging due to nondeterministic background t

parallel tcp streams deep reinforcement learning network bandwidth utilization online optimization algorithms network congestion

发现论文，激发创造

深度强化学习在互联网拥塞控制中的应用

该研究利用深度强化学习（RL）算法解决互联网拥塞控制问题，成果表明该 RL 指导拥塞控制方法在数据流量和网络环境的复杂模式识别方面性能卓越但也需要解决公平性、安全性、泛化问题。此外，研究提出基于 OpenAI Gym 接口的测试套件，以促进对该方法的进一步研究和可重复性。

Oct, 2018

物理层路由和频谱访问的可扩展深度强化学习

本文提出了一种可扩展的强化学习方法，用于同时路由和频谱访问无线自组网中的信号传输，根据邻居节点的地理位置信息智能地制定联合路由和频谱分配决策。

Dec, 2020

下一代网络中自适应交通路由的深度增强学习方法

我们研究并开发了一种深度强化学习（DRL）方法，用于自适应流量路由，该方法利用深度图卷积神经网络（DGCNN）在 DRL 框架中学习流量行为，并通过 Q 值估计选择路由路径，实现对流量动态的快速适应。与 OSPF 协议相比，实验结果表明了该框架的有效性和适应性，在增加网络吞吐量高达 7.8% 和减少 16.1% 的流量延迟方面取得了显著效果。

Feb, 2024

未见流量场景下通信负载平衡的策略重用

本研究提出了一种基于强化学习的策略重用框架，通过在各种交通场景下训练和存储策略，并结合流量条件，选择最适合的预训练策略以更好地解决通信网络负载均衡问题。实验结果表明，这种方法比传统的基于规则和适应性方法表现更出色。

Mar, 2023

基于优化理论的深度强化学习用于超可靠无线网络控制系统资源分配

基于优化理论的深度强化学习框架被介绍用于联合设计控制和通信系统，并针对最小化功耗目标，在满足通信系统的调度性和速率约束以及控制系统的稳定性约束的前提下，通过优化理论和深度强化学习两个阶段的组合来实现，该方法在大量的模拟实验中表现出优于优化理论和纯深度强化学习方法的性能，接近最优性能且复杂度较低。

Nov, 2023

强化学习代理设计与优化及带宽分配模型

研究了基于强化学习的资源分配问题，结合了 BAM 模型以优化强化学习代理的设计和效率，分析模拟结果表明模型在减轻强化学习代理负担和优化执行方面具有很大潜力。

Nov, 2022

基于并行引导策略的深度强化学习在连续流控制应用中的研究

本论文介绍了一种基于深度强化学习的数值流控制方法，提出了一种在保持更新策略性的同时，在分布式环境中检索部分轨迹缓冲区来增强控制模型的并行模式。

Apr, 2023

限带宽下的多智能体通信学习 —— 基于互联网数据包路由的应用

本研究提出了一种门控机制来自适应地剪枝无用消息，使得在多智能体通信时，性能得到显著提升，同时在真实世界中的数据包路由任务和四个基准测试任务中，比现有的基于深度强化学习和基于规则的方法都表现良好。

Feb, 2019

基于深度强化学习的体验驱动网络

本文提出了一种基于深度强化学习的通信网络控制框架 DRL-TE，通过学习并决策网络环境和动态变化，实现流量工程问题中代价函数的自动最优化，并在模拟实验中证明其相比于传统方法表现更佳。

Jan, 2018

基于深度强化学习的流处理通用资源分配

本文介绍了一种图嵌入式的编码器 - 解码器框架，以实现在流处理中分配资源任务，同时确保工作负载平衡和通信最小化。采用深度强化学习方法，有效地学习和求解未知图的最优解，并在测试中表现优于 METIS 算法和基于 LSTM 的编码器 - 解码器模型约 70％。

Nov, 2019