BriefGPT.xyz
Ask
alpha
关键词
opportunistic spectrum access
搜索结果 - 4
无线认知网络中的多智能体混合 SAC 算法实现联合 SS-DSA
通过利用混合软行为者评论家算法的多智能体强化学习方法,实现了动态频谱访问中联合频谱感知和资源分配的优化,以最大化网络的通信速率,并在实验中验证了该算法在增加频谱资源利用率、限制对主网络干扰方面优于现有技术。
PDF
2 months ago
休息和不休息赌博机的在线学习
本文研究了涉及休息和不休息的多臂赌博机和多次游戏的在线学习问题,在每个时间步骤,用户可以玩 M 支手臂,其目标是决定每一步要播放哪些 K 支手臂,以在一系列试验中最大化其长期奖励,尤其与机会式频谱接入(OSA)的应用相关。
PDF
13 years ago
机会主义频谱接入中的在线学习:一种不稳定赌博机方法
本文介绍了一种利用 Markov 链的再生周期计算基于样本均值的索引策略的算法,证明了在马尔可夫链状态转移概率有渐进周期性且保持足够的多样性的情况下,该算法在时间上一致地实现对数遗憾,并且证明了该遗憾阈值也是最优的。
PDF
14 years ago
MM
多通道机会式接入:多次播放的不安定赌博模型
本文研究了随机控制问题在机会式频谱访问中的应用,提出了设计一种通道选择策略,以最大化预期折扣总报酬为目标,将问题与该类问题现有文献进行了讨论。
PDF
15 years ago
Prev
Next