从司机中学习，应对亚马逊的最后一英里路线研究挑战

May, 2022

从司机中学习，应对亚马逊的最后一英里路线研究挑战

Learning from Drivers to Tackle the Amazon Last Mile Routing Research Challenge

Chen Wu, Yin Song, Verdi March, Eden Duthie

TL;DR本研究旨在将 Amazon 司机的实践经验融入到最佳路线规划中，我们提出了一种机器学习和传统 TSP 求解器结合的分层方法来处理这个挑战。该方法在历史路线的区域级别学习了一个顺序概率模型，并使用 Rollout 算法生成从学习的概率模型中采样的可信区域序列来编码驱动程序的专业知识，并有效地排序每个区域的站点，该方法取得了 0.0374 的评估分数。

Abstract

The goal of the amazon last mile routing research challenge is to integrate the real-life experience of Amazon drivers into the solution of optimal route planning and optimization. This paper presents our method that tackles this challenge by hierarchically combining →

amazon last mile routing research challenge machine learning traveling salesperson problem rollout algorithm route optimization

发现论文，激发创造

面向偏好的末端物流配送规划

本文提出了一种新的分层路由优化器，该优化器结合了优化和机器学习，通过可学习参数解决了有挑战性的最后一英里物流服务中遇到的困难的实际问题，并使用亚马逊的真实交付数据集证明了这种方法的重要性。

Mar, 2023

最后一公里配送偏好学习的概率估计和结构化输出预测

本研究探讨了在最后一英里交付的背景下，学习司机和规划者偏好的问题，然后提出了概率估计和机器学习相结合的方法，以最大限度地平衡多个目标，并提出了一种两阶段方法来解决 TSP 问题。

Jan, 2022

学习巡回：运算符设计用于解决方案可行性映射的接送旅行推销员问题

本文旨在开发一种用于一类特殊旅行推销员问题（TSP）的学习方法，即接送 TSP（PDTSP），该方法通过一系列一对一接送节点找到最短路径。我们利用可行解算空间中的操作符来解决 PDTSP，这些操作符将一个可行解映射到另一个可行解，从而限制解决方案搜索范围。通过与经典 OR 算法和现有学习方法进行比较，结果表明我们的方法可以找到比基准更短的路径。

Apr, 2024

第一届 AI4TSP 大赛：学习解决随机路线问题

介绍 2021 年国际人工智能联合大会（IJCAI-21）上第一个旅行推销员问题（TSP）人工智能竞赛，关注基于学习的算法，介绍了该竞赛的问题、比赛安排、获胜方法和结果概述。竞赛的胜利方法使 AI 在随机路由问题上取得了技术进步，也使路由问题成为 AI 研究人员感兴趣的问题设定。同时，该比赛所使用的路由问题模拟器现已成为开源工具，可以成为其他研究人员使用的新 AI 方法基准测试。

Jan, 2022

电子商务中高效履约和路由策略的多智能体学习

该研究提出了一个集成算法框架，用于在电子商务中最小化产品送货成本（成本对服务或 C2S）。通过结合图神经网络和强化学习来训练节点选择和车辆路径规划代理，我们的实验结果表明，这种算法流程胜过纯启发式策略。

Nov, 2023

DRL4Route：一种基于深度强化学习的提取和交付路线预测框架

目前对 Pick-up and Delivery Route Prediction 的研究主要集中在利用深度神经网络、强化学习等方法来预测工人的服务路线，并提出了一种名为 DRL4Route 的基于强化学习的框架用于改善现有的深度学习模型，其中 DRL4Route-GAE 模型在物流服务中更进一步实现了平衡偏差和方差的策略优化，通过离线与在线实验表明相对于现有方法能够分别提高 Location Square Deviation（LSD）0.9%-2.7% 和 Accuracy@3（ACC@3）2.4%-3.2%。

Jul, 2023

学会解决旅行商问题要重新思考泛化

本文提出了一种神经组合优化方法，将学习算法与模型架构相结合，以实现在训练过程中看不到的更大规模的问题的推广。通过对零样本推广的原理研究，控制实验提供了第一手数据，并提供了深度学习的新方向。

Jun, 2020

结合强化学习和最优传输的旅行商问题

利用熵正则化最优传输技术作为深度强化学习网络中的一层，以实现更快速的学习并在端到端训练期间强制执行分配约束和规定，从而对于解决组合优化问题的效率进行优化。

Mar, 2022

学习协作策略以解决 NP-hard 路径规划问题

本论文提出了一种新的层次化问题求解策略，称为学习协作策略，它使用两个迭代的深度强化学习策略：播种机和修订机，旨在有效地找到近似最优解，扩展了深度强化学习框架在解决 NP-hard 路由问题方面的应用。

Oct, 2021

深度强化学习与旅行购买问题

基于深度强化学习的旅行购货问题（TPP）解决方案，通过使用双向图表示 TPP、策略网络逐步构建路线，并通过线性规划获取购货计划，利用元学习策略稳定训练策略网络。在综合合成和标准基准测试上，相较于已有启发式算法，我们的 DRL 方法能够显著提升解决方案质量（降低 40%-90% 的最优性差距），尤其在大型实例上具备高效性。

Apr, 2024