Nov, 2022

动态、稀疏和部分观测环境中的信息增益传感器控制

TL;DR本文提出了一种在部分可观察的、动态和稀疏采样环境下进行自主传感器控制的方法,特别是在射频 (RF) 频谱监测方面,采用预测和信息增益奖励的 DAN 强化学习框架,并使用来自 RF 领域有限的样本迭代改进环境模型。通过基于不同复杂度和评估指标的模拟实验,验证了该方法优于基线专家设计控制器且适应非平稳环境的鲁棒性。