基于图网络的可靠实时城市空中出行车队调度对抗学习框架

Jul, 2024

基于图网络的可靠实时城市空中出行车队调度对抗学习框架

A Graph-based Adversarial Imitation Learning Framework for Reliable & Realtime Fleet Scheduling in Urban Air Mobility

Prithvi Poddar, Steve Paul, Souma Chowdhury

TL;DR城市空中出行（UAM）的广泛采用和经济可行性在一定程度上取决于在UAM网络中如何对飞机机队进行最优调度，其中不确定性包括空域拥塞、变化的天气条件和不同的需求。本文提出了飞机机队调度问题的全面优化形式，同时也指出需要替代的解决方案，因为直接解决生成的非线性整数规划问题在每日机队调度中在计算上是禁止的。先前的研究表明使用（图形）强化学习（RL）方法来训练实时可执行的机队调度策略模型是有效的。然而，这种策略在分布场景或边缘情况下通常是脆弱的。此外，随着问题复杂性（例如约束数量）的增加，训练性能也会下降。为了解决这些问题，本文提出了一种模仿学习方法，其中基于RL的策略利用通过遗传算法解决确切优化问题而产生的专家演示。该策略模型包括基于图神经网络（GNN）的编码器，将垂直港口和飞机嵌入空间，变压器网络对需求、乘客票价和运输成本进行编码，以及基于多头注意力（MHA）的解码器。通过生成对抗性模仿学习（GAIL）算法使用专家演示。与涉及8个垂直港口和40架飞机的UAM模拟环境交互，以日利润奖励为指标，新的模仿方法在平均性能和未知最坏情况场景的显着改进方面优于纯RL结果。

Abstract

The advent of urban air mobility (UAM) presents the scope for a transformative shift in the domain of urban transportation. However, its widespread adoption and economic viability depends in part on the ability to optimally schedule the fleet of aircraft across vertiports in a UAM netw

发现论文，激发创造

平衡逆强化学习用于出租车网络

该研究提出了一种算法，能够在具有自主性的司机行为中，通过利用值迭代方法和策略传播计算所有乘客和司机的均衡策略，在 spatio-temporal distributions 与税车轨迹数据集等多个方面表现出优异的性能。

Feb, 2021

共享自主出行服务的预测性车队再定位：一种基于优化和学习的方法

本文关注的是在共享AV机动车辆出行服务 (SAMSs) 中，空闲车辆的预测性行驶问题。将该问题建模为马尔可夫决策过程，并提出了一种使用优势 actor-critic (A2C) 方法的强化学习方法, 与基于优化的分配策略协作，学习一个预测性均衡策略。实验证明，该方法通过观察过去的需求并能够预测未来的需求，显著降低了乘客的等待时间。

Oct, 2022

自主驾驶规划中基于层次模型的模仿学习

使用MGAIL在密集城市自动驾驶方面进行了第一次大规模应用，通过使用分层模型和经过现实汽车采集的经验轨迹进行性能度量，并结合闭环MGAIL损失和开环行为克隆损失实现了稳健的导航策略。

Oct, 2022

高级空中机动的图形关注多智能体车队自治

介绍了部分可观察的先进空中移动游戏的概念，提出了一种新的异构图注意力编码器-解码器(HetGAT Enc-Dec)神经网络，以构建可推广的随机策略来协调机动车辆代理，此政策通过深度一致性学习进行训练，使代理人能够使用其本地观察进行分散的决策制定。通过大量实验表明，采用 HetGAT Enc-Dec 政策的车队在按需移动网络中表现最佳。

Feb, 2023

机场地面处理车辆路径问题中的大邻域搜索学习

该研究提出了一种新的基于深度学习技术的车辆路径问题求解方法，以优化机场地勤中的车队调度，实验结果表明该方法在处理多达200个航班和10种操作时表现非常优秀，并在不同情况下表现出了很好的鲁棒性和广泛适用性。

Feb, 2023

GA-DRL：图神经网络辅助深度强化学习用于动态车联网中的DAG任务调度

本文提出了一种基于图神经网络和深度强化学习的车联网环境下DAG任务调度方案，通过采用多头注意力网络，对DAG子任务进行特征提取，同时考虑了任务拓扑结构和车辆动态特征，通过模拟实验表明该方案在完成DAG任务时间方面优于现有基准。

Jul, 2023

基于图学习的城市空中交通管理垂直港决策支持快速方案

本文提供了一种应用图强化学习来解决城市空中移动（UAM）-垂直港口调度管理（UAM-VSM）问题的新方法，通过使用图卷积网络（GCN）进行功能提取，并通过感知器层来决定不同动作，从而优于基本的强化学习或随机选择基准。

Aug, 2023

基于图学习的城市空中移动车队调度：面向运营约束、需求变动和不确定性

本文提出了一种基于图强化学习的方法，用于在线规划多个垂降站之间的电动飞机航班和目的地。训练数据表明，这种方法在性能和效率方面表现优秀。

Jan, 2024

城市空中移动的自组织到达系统

城市空中移动是一种创新的交通方式，其中电动垂直起降（eVTOL）飞行器在被称为垂直机场的节点之间运行。我们基于深度强化学习，概述了一种自组织垂直机场到达系统。我们研究了在训练过程中强化学习策略的发展，并且展示了算法从次优的局部保持模式逐步转变为安全高效的最终策略。后者通过基于仿真的场景验证，并在小型无人机上进行了真实世界可用性的展示。

Apr, 2024

车队动力总成控制策略的共享学习

通过使用一种简化的群体策略作为知识共享机制，我们提出了一种新颖的框架，用于车队的共享学习，以解决深度强化学习在服务路线分布的车队中学习稳定性问题，从而在燃油经济性等指标上取得明显优势。

Apr, 2024