一种安全且加速的基于深度强化学习的 O-RAN 切片的混合迁移学习方法

MMSep, 2023

一种安全且加速的基于深度强化学习的 O-RAN 切片的混合迁移学习方法

Safe and Accelerated Deep Reinforcement Learning-based O-RAN Slicing: A Hybrid Transfer Learning Approach

Ahmad M. Nagib, Hatem Abou-Zeid, Hossam S. Hassanein

TL;DR提出了使用深度强化学习 (DRL) 算法的开放无线接入网络 (O-RAN) 切片的转移学习 (TL) 辅助方法，通过政策复用和蒸馏转移学习方法实现了快速收敛和改进泛化能力，显著提高了初始奖励值和收敛场景百分比，减少了奖励方差。

Abstract

The open radio access network (O-RAN) architecture supports intelligent network control algorithms as one of its core capabilities. Data-driven applications incorporate such algorithms to optimize radio access network (RAN) functions via RAN intelligent controllers (RICs). Deep reinfor

open radio access network drl algorithms transfer learning o-ran slicing policy reuse

发现论文，激发创造

基于注意力的深度强化学习的开放式无线接入网络切片管理

本文介绍了一种基于 O-RAN 模块和分布式代理合作，利用注意力机制的深度强化学习（ADRL）技术，以实现更好的网络性能，通过有效信息提取和实现泛化，提出了在分布式代理之间引入值 - 注意力网络来实现可靠和最优决策。模拟结果证明，与其他深度强化学习基线方法相比，该方法显著提高了网络性能。

Jun, 2023

O-RAN 动态切片管理的演化深度强化学习

本文介绍了一种新的管理网络切片的框架，该框架使用了基于演化的深度强化学习 (EDRL) 方法，将 O-RAN 切片表示为马尔可夫决策过程 (MDP)，并通过对资源分配的最优解来满足服务需求，模拟结果表明，所提出的方法比 DRL 基线提高了 62.2% 的服务质量。

Aug, 2022

面向下一代无线网络的安全和加速深度强化学习

本文主要讨论了 DRL 技术在无线网络领域中的应用，提出了安全性和加速性等难点问题，并对安全加速 DRL 的解决方案进行了分类和讨论，最后通过案例研究展示了如何通过传输学习和安全探索来加速智能无线接入网络的 DRL 控制器收敛。

Sep, 2022

预测对 O-RAN 切片中 DRL 技术收敛的影响是如何的？

通过时间序列预测流量需求对深度强化学习 (DRL) 的收敛性进行研究，提出了一种新的预测辅助 DRL 方法，实现了 DRL 代理的改进和泛化性能优化。

Sep, 2023

开放 RAN 中使用深度强化学习的 LSTM 流量预测和切片管理

通过使用分布式深度强化学习和基于长短期记忆的预测方法，本文介绍了一种利用分布式单元在开放式无线接入网络系统中进行网络切片 xApp 的新方法，并展示了显著提高网络性能、特别是减少服务质量违规的模拟结果。

Jan, 2024

离线强化学习推进 RAN 切片技术

该研究介绍了离线强化学习（RL）在解决无线网络中的无线电资源管理（RRM）问题方面的应用，展示了它学习接近最优策略的能力，适应不同的服务级别要求，并在各种 RAN 分割场景中发挥潜力。

Dec, 2023

O-RAN 中网络切片的高效资源分配的半监督学习方法

我们提出了一种创新的方法，旨在协调 Open Radio Access Network（O-RAN）中的多个独立 xAPPs，以实现网络切片和资源分配，并优化用户设备（UE）之间的加权吞吐量和物理资源块（PRB）的分配。通过设计 power control xAPP 和 PRB allocation xAPP，我们的方法通过监督学习和无监督学习的组合实现了高效的网络切片问题解决方案。与其他方法相比，我们的方法在不同场景中展现出更高的性能和效果。

Jan, 2024

基于深度强化学习的智能 O-RAN URLLC 流量引导

该研究提出基于机器学习的交通引导方案以预测网络拥塞并在避免其的基础上通过优化设置来服务具备低延迟和高可靠性需求的 URLLC 应用。在 O-RAN 中，比传统反应式交通引导方法平均减少 15.81％的排队延迟。

Mar, 2023

基于迁移学习的多主体深度强化学习实现跨小区网络分片

本文提出了一种基于多个深度强化学习代理的 DIRP 算法来协作优化资源分区，为网络切片满足每个应用的要求；同时设计了一种新颖的迁移学习辅助 DIRP 算法（TL-DIRP），以实现大规模移动网络中的可操作性和转移性。实验结果表明，TL-DIRP 非常大程度地提高了服务性能，为最差服务质量提供约 15% 的违规比率，平均服务 QoS 提供 8.8% 的违规。

Jun, 2023

RLOps: 基于强化学习协助的开放式无线接入网开发生命周期

本文介绍了机器学习在 Open RAN 技术中的应用，提出了一种名为 RLOps 的系统化模型开发、测试和验证生命周期，探讨了该方法的最佳实践，并设计实现了一个基于 O-RAN 部署的数据分析平台。

Nov, 2021