Feb, 2025
通过少样本元离线强化学习实现鲁棒的无人机轨迹规划
Resilient UAV Trajectory Planning via Few-Shot Meta-Offline
Reinforcement Learning
TL;DR本研究解决了现有强化学习框架在安全性和成本问题上对在线交互的依赖,以及在动态或新环境中的可扩展性不足。提出了一种新颖的少样本元离线强化学习算法,能够在没有在线交互的情况下,利用静态离线数据集训练模型,并实现对新环境的有效扩展。研究结果表明,该算法在优化无人机轨迹和调度策略方面表现优越,能够快速收敛并在数据点少的情况下实现最佳的年龄信息和传输功率平衡。