Mar, 2024

基于主动推理的无人机辅助无线网络自主路径规划

TL;DR一种用于 UAV 辅助网络的新型自监督路径规划方法,通过离线解决训练示例并使用解决方案作为演示来让 UAV 学习世界模型从而理解环境,并隐含地发现优化器的策略。具备世界模型的 UAV 可以进行实时自主决策和在线规划,通过对预期惊喜进行评分,可以选择最优策略。此方法比传统的 RL 更快适应新情境且性能更好,从而具备更广泛的泛化能力。