BriefGPT.xyz
大模型
Ask
alpha
关键词
drl algorithms
搜索结果 - 3
在资源受限环境下利用知识蒸馏提升高效深度强化学习
通过挖掘深度强化学习(Deep Reinforcement Learning,DRL)与知识蒸馏(Knowledge Distillation,KD)相结合的潜力,本文通过蒸馏各种 DRL 算法并研究其蒸馏效果的方式,旨在减少深度模型的计算
→
PDF
9 months ago
MM
一种安全且加速的基于深度强化学习的 O-RAN 切片的混合迁移学习方法
提出了使用深度强化学习 (DRL) 算法的开放无线接入网络 (O-RAN) 切片的转移学习 (TL) 辅助方法,通过政策复用和蒸馏转移学习方法实现了快速收敛和改进泛化能力,显著提高了初始奖励值和收敛场景百分比,减少了奖励方差。
PDF
10 months ago
Tianshou: 一个高度模块化的深度强化学习库
本文介绍了 Tianshou,这是一个高度模块化的 Python 库,使用 PyTorch 作为其后端,旨在提供灵活可靠的深度强化学习算法基础设施,支持在线和离线训练,具有统一接口,并通过 MuJoCo 环境的基准测试证明了其可靠性。
PDF
3 years ago
Prev
Next