从司机中学习,应对亚马逊的最后一英里路线研究挑战
本文提出了一种新的分层路由优化器,该优化器结合了优化和机器学习,通过可学习参数解决了有挑战性的最后一英里物流服务中遇到的困难的实际问题,并使用亚马逊的真实交付数据集证明了这种方法的重要性。
Mar, 2023
本研究探讨了在最后一英里交付的背景下,学习司机和规划者偏好的问题,然后提出了概率估计和机器学习相结合的方法,以最大限度地平衡多个目标,并提出了一种两阶段方法来解决 TSP 问题。
Jan, 2022
本文旨在开发一种用于一类特殊旅行推销员问题(TSP)的学习方法,即接送 TSP(PDTSP),该方法通过一系列一对一接送节点找到最短路径。我们利用可行解算空间中的操作符来解决 PDTSP,这些操作符将一个可行解映射到另一个可行解,从而限制解决方案搜索范围。通过与经典 OR 算法和现有学习方法进行比较,结果表明我们的方法可以找到比基准更短的路径。
Apr, 2024
介绍 2021 年国际人工智能联合大会(IJCAI-21)上第一个旅行推销员问题(TSP)人工智能竞赛,关注基于学习的算法,介绍了该竞赛的问题、比赛安排、获胜方法和结果概述。竞赛的胜利方法使 AI 在随机路由问题上取得了技术进步,也使路由问题成为 AI 研究人员感兴趣的问题设定。同时,该比赛所使用的路由问题模拟器现已成为开源工具,可以成为其他研究人员使用的新 AI 方法基准测试。
Jan, 2022
该研究提出了一个集成算法框架,用于在电子商务中最小化产品送货成本(成本对服务或 C2S)。通过结合图神经网络和强化学习来训练节点选择和车辆路径规划代理,我们的实验结果表明,这种算法流程胜过纯启发式策略。
Nov, 2023
目前对 Pick-up and Delivery Route Prediction 的研究主要集中在利用深度神经网络、强化学习等方法来预测工人的服务路线,并提出了一种名为 DRL4Route 的基于强化学习的框架用于改善现有的深度学习模型,其中 DRL4Route-GAE 模型在物流服务中更进一步实现了平衡偏差和方差的策略优化,通过离线与在线实验表明相对于现有方法能够分别提高 Location Square Deviation(LSD)0.9%-2.7% 和 Accuracy@3(ACC@3)2.4%-3.2%。
Jul, 2023
本文提出了一种神经组合优化方法,将学习算法与模型架构相结合,以实现在训练过程中看不到的更大规模的问题的推广。通过对零样本推广的原理研究,控制实验提供了第一手数据,并提供了深度学习的新方向。
Jun, 2020
利用熵正则化最优传输技术作为深度强化学习网络中的一层,以实现更快速的学习并在端到端训练期间强制执行分配约束和规定,从而对于解决组合优化问题的效率进行优化。
Mar, 2022
本论文提出了一种新的层次化问题求解策略,称为学习协作策略,它使用两个迭代的深度强化学习策略:播种机和修订机,旨在有效地找到近似最优解,扩展了深度强化学习框架在解决 NP-hard 路由问题方面的应用。
Oct, 2021
基于深度强化学习的旅行购货问题(TPP)解决方案,通过使用双向图表示 TPP、策略网络逐步构建路线,并通过线性规划获取购货计划,利用元学习策略稳定训练策略网络。在综合合成和标准基准测试上,相较于已有启发式算法,我们的 DRL 方法能够显著提升解决方案质量(降低 40%-90% 的最优性差距),尤其在大型实例上具备高效性。
Apr, 2024