Jul, 2023

通过强化学习的实时频谱监测——Q学习和启发式方法的比较

TL;DR本研究比较了线性频率调谐作为启发式方法和来自强化学习领域的 Q-learning 算法这两种不同方法在控制可用接收机资源方面。经过简化的情景测试表明,Q-learning 算法相对于启发式方法具有更高的检测率,同时可以通过参数化实现检测与探索率之间的权衡。