MMJul, 2021

基于学习的近似 POMDP 的认知无线电频谱感知和接入

TL;DR提出了一种新的 LEarning-based Spectrum Sensing and Access (LESSA) 框架,采用 Baum-Welch 算法学习参数化 Markov 转移模型以控制决策,通过随机点值迭代方法将频谱感知和接入定义为部分可观测的 Markov 决策过程,并提出基于协作的 TD-SARSA 方法以及贪心分布式学习的 MA-LESSA,其中,MA-LESSA 在 DARPA SC2 平台上取得了显著的性能优势和实现可行性的验证.