使用卷积变换器的能量模型进行跨模态定位

Jun, 2023

使用卷积变换器的能量模型进行跨模态定位

Energy-Based Models for Cross-Modal Localization using Convolutional Transformers

Alan Wu, Michael S. Ryoo

TL;DR使用基于能量的模型框架对非 GPS 地面车辆进行定位，并结合激光雷达传感器和卫星图像进行跨模态测量级定位的方法，实验结果表明其在 KITTI、Pandaset 和自定义数据集上的表现优于现有最优解的方法。

Abstract

We present a novel framework using energy-based models (EBMs) for localizing a ground vehicle mounted with a range sensor against satellite imagery in the absence of GPS. →

energy-based models localization lidar sensors satellite imagery convolutional transformers

发现论文，激发创造

无线通信的多模态变压器：波束预测案例研究

本文介绍了一种多模态变压器深度学习框架，用于辅助感知的波束预测。通过使用卷积神经网络从一系列图像、点云和雷达原始数据中提取特征，并使用变压器编码器学习不同模态和时间实例之间的隐藏关系，生成下一级特征提取的编码向量。通过在不同模态的组合上进行监督学习来训练模型，实验结果表明，使用图像和 GPS 数据训练的解决方案在预测波束的距离准确率方面表现最佳，为 78.44％，并具有有效的推广性。

Sep, 2023

用 Transformer 实现姿态作为查询：图像到 LiDAR 地图的定位

本研究提出一种新型的基于 Transformer 的神经网络，可以在 end-to-end 的情况下将 2D 图像注册到 3D LiDAR 地图中进行车辆定位，达到了一定的准确度和实用性。

May, 2023

多模态变换器增强的 LiDAR 点云生成的生成式人工智能

通过综合感知和通信技术，提出了一种利用图像和雷达数据合成激光雷达点云的方法，从而增强无线通信系统的性能，并通过与现有感知模态的整合，提高各种无线应用的表现。

May, 2024

跨视角图像检索之外：使用卫星图像实现高精度车辆定位

本文提出了一种车载摄像机定位的解决方案，通过神经网络和几何投影模型实现从地面图像匹配到高空卫星地图上，并把匹配问题转化为姿态估计问题来提高定位精度。

Apr, 2022

基于学习嵌入的卫星图像定位

本文提出了一种基于视觉的方法，利用公开的卫星图像作为对环境的唯一先验知识，对地面车辆进行定位，并通过神经多视点模型消除图像之间的视角和外观差异。实验证明，该方法能够在训练集之外的环境中定位地面图像。

Apr, 2017

用于具身视觉的模态不变视觉里程计

提出一种基于 Transformer 的模态不变的 Visual Odometry 方法，可以应对不同或变化的导航代理的传感器套件，该模型在仅使用部分数据进行训练时，优于先前的方法。

Apr, 2023

RaLL: 使用可微分的测量模型在激光雷达地图上实现端到端的雷达定位

本文提出一种基于深度学习的 RaLL 框架，将雷达和激光雷达嵌入到共同的神经网络特征空间中，利用激光雷达现成的映射技术来实现雷达在室外环境下的精准定位和低成本的雷达地图构建。实验结果表明，该系统在 90km 的驾车中具有优异的性能，甚至在 UK 训练，South Korea 测试的泛化场景中仍然表现出色。

Sep, 2020

多模态融合 Transformer 用于端到端自动驾驶

本文提出使用多模态融合转换器 TransFuser 对图像和 LiDAR 传感器的信息进行整合以实现先进的自动驾驶技术，在 CARLA 城市驾驶模拟器中实验验证证明该方法在处理复杂场景时比传统基于几何的融合方法有更好的效果，并且在减少碰撞方面表现出色。

Apr, 2021

使用稠密不确定度估计的视觉跨视图度量定位

本文使用新型网络结构和更密集的卫星图像描述符进行多模式区域定位，可将度量定位误差中位数相对于同一区域、跨区域和跨时间的现有技术分别降低 51％、37％和 28％。

Aug, 2022

自主驾驶的交叉模态轨迹预测

本文提出了一种基于跨模态嵌入框架的自动驾驶预测交通代理未来轨迹的方法，利用多种输入模式和相关传感器来预测未来轨迹，具有较好的预测效果。

Apr, 2020