通过使用数据同化推断和强化学习优化采样策略的思路,研究展示了一个基于无人机观测的地表通量估计框架,证明了强化学习训练的无人机可以更准确地量化 CO2 热点,而非沿预定义路径进行采样的无人机,这为进一步开发复杂地表通量场的映射框架提供了有价值的见解。
Jan, 2024
基于空间分布浓度测量的气体源位置估计的新方法,使用物理引导型神经网络来近似气体分散,并将源位置作为额外的网络输入,避免昂贵的数值模拟,实验证明该方法能够准确定位气体源。
May, 2024
本文提出了一种在部分可观察的、动态和稀疏采样环境下进行自主传感器控制的方法,特别是在射频 (RF) 频谱监测方面,采用预测和信息增益奖励的 DAN 强化学习框架,并使用来自 RF 领域有限的样本迭代改进环境模型。通过基于不同复杂度和评估指标的模拟实验,验证了该方法优于基线专家设计控制器且适应非平稳环境的鲁棒性。
Nov, 2022
通过开发计算上高效且有效的算法,我们为在不确定信念状态下预测可能的传感器测量结果这一困难问题提供了一个更精确的近似解。实验结果表明,在多旋翼飞行器的广泛模拟和实地实验中,我们的方法在无线电源跟踪和定位问题中取得了改进的性能增益。
本篇论文研究的是一个应用于移动机器人自主探索和检查的问题,即在燃料预算有限的情况下最大化从世界中获取的信息量的问题。作者提出了一种新颖的数据驱动的模仿学习框架,并通过 EXPLORE 算法来训练一个策略以模仿一个有完整信息并计算非简约解来最大化获取信息的先知,验证了这一方法在不同对象分布上的适应能力。
Nov, 2016
该论文提出一种新的端到端强化学习方法来规划机载无人机收集物联网中的分布式传感器节点的数据,以实现对下一代通信网络的支持。通过训练一个双重深度 Q 网络来实现对不同情况参数的泛化控制,从而使代理可以根据平衡数据收集目标和飞行时间效率的安全约束,在各种场景参数下做出运动决策。
Jul, 2020
本论文提出一种使用水质传感器装备的自主水面船只的深度 Q-Learning 算法框架,解决它在静态和动态环境下的监控任务中的障碍物避免以及路径规划问题,结合信息增益来衡量不确定性,模拟实验表明噪声网络是增强探测的良好选择,该框架成功应用于自主监控下的水资源监测。
Oct, 2022
研究了一种 UAV 辅助的无线网络,通过 Markov 决策过程和深度强化学习算法优化飞行轨迹和任务调度来最小化信息年龄值的加权和,取得了显著的研究成果。
May, 2019
本文提出了一种基于高斯过程的路径规划算法,以最大化信息获取并满足资源约束;同时,通过多机器人问题中的分配技巧,将该算法扩展到环境监测等多领域中。
Jan, 2014
本篇研究探讨将无人机和可重构智能表面元素与物联网设备集成以被动中继信息的好处,并通过优化问题来最小化平均信息时效,并且使用近端策略优化算法来解决混合整数非凸优化问题,结果表明我们的算法在 AoI 方面优于其他所有算法。
Nov, 2020