利用动态编码器 - 解码器结构的动态关注模型来更好地解决车辆路径问题,并显示出良好的泛化性能。
Feb, 2020
我们提出了一种自适应图注意力采样与边融合框架(GASE),通过使用具有高度相关邻域和边的注意力计算从而确定节点的嵌入,进一步融合采样网络中的消息传递和节点嵌入,在学习导向的 VRP 任务上表现出色,并在随机生成实例和真实世界数据集上展现出超越现有方法的性能。
May, 2024
本研究提出一种视频故事问答架构,名为 Multimodal Dual Attention Memory (MDAM)。使用双重注意机制,结合自我注意力和注意力机制在场景帧和字幕中学习潜在的概念,并在双重注意力处理后执行多模态融合,从而学习从整个视频内容的抽象中推断出高级视觉语言联合表示。在 PororoQA 和 MovieQA 数据集上,该模型均取得了新的最优结果,并通过消融研究验证了双重注意机制与后期融合的最佳性能。
Sep, 2018
基于深度强化学习,使用编码器 - 解码器的注意机制生成的策略在某些车辆路径问题上表现出有效性,但在某些复杂车辆路径问题上,仍缺乏有效的强化学习方法。本研究针对一种包含多辆卡车和多段路径要求的车辆路径问题变体,扩展现有的编码器 - 解码器注意模型,使其能够处理多辆卡车和多段路径需求,并在日本汽车零部件制造商爱信公司的实际供应链环境中测试,发现我们的算法优于爱信公司的最佳解决方案。
Jan, 2024
本研究使用自注意力模块来计算社交和物理上下文情境,采样白噪声,探索了生成模型中注意力的影响,并在 Argoverse 运动预测基准 1.1 上取得了竞争力的单峰结果。
Sep, 2022
利用深度强化学习的编码器 - 解码器模型,并借助于复杂的张量需求结构,可以解决多车辆多节点的物流配送问题,从而实现对汽车配送业务的优化。
Nov, 2022
本文提出了一种新的基于多头注意力的车辆运动预测方法,它能够通过多模态概率密度函数的序列来对道路场景中的所有车辆进行联合预测,不需要机动定义,并且不使用空间网格来表示场景,这使得它比类似模型更加灵活,同时具有交互式联合预测、不确定性估计和多模态性的所有预测能力,结果表明该模型的预测准确率优于同一数据集上的现有模型
Oct, 2019
本文研究自动驾驶汽车预测未来路障轨迹的问题,提出了一种基于动态图注意力网络的方法,针对交通规则、社交互动、多类交通运动等方面的挑战,能够使用单一模型对多模态轨迹进行概率预测,并经过多个数据集的验证,证明该方法具有实际应用潜力且优于现有技术。
Mar, 2021
提出了一种多模态融合变压器,结合驾驶员注意力用于自动驾驶,通过 Lidar-Vision-Attention-based Fusion 模块更好地融合多模态数据,并实现不同模态之间更高的对齐,同时结合驾驶员的注意力,赋予自动驾驶车辆类似于人类的场景理解能力,准确识别复杂场景中的关键区域,确保安全。在 CARLA 模拟器上进行实验,以较少的数据在闭环基准测试中取得了最先进的性能。
Mar, 2024
本文介绍了一种使用概率多模式预测方法和社交影响建模的新型 GAN,可有效预测人群行为和行人意图,以达到更好的自动驾驶和移动机器人导航效果。
Jun, 2020