Mar, 2024

通过深度符号回归实现闭式拥塞控制

TL;DR该论文提出了一种使用强化学习和深度符号回归来处理 5G 时代中超低时延和高吞吐场景下拥塞控制问题的方法。通过训练一个专门针对类似前传网络的拥塞控制策略,并采集基准策略的状态 - 动作经验,使用深度符号回归方法处理实时推理的挑战,从而实现基准策略的性能和泛化能力。该方法能够近似基准性能(链路利用率、延迟和公平性)并可以直接在任何编程语言中实现,并对闭合形式表达式的内部工作进行了分析。