BriefGPT.xyz
Ask
alpha
关键词
cross-modal localization
搜索结果 - 4
LIP-Loc: 跨模态定位的激光雷达图像预训练
利用对比映射预训练(CLIP)方法在图像与 LiDAR 点云的交叉模态本地化任务中,首次应用批处理损失方法并展示了零样本转移,并在 KITTI 数据集上取得了超过当前最先进方法 22.4% 的准确性提升,而且无需复杂的网络架构。
PDF
6 months ago
WSDM
WSDM2023 Toloka VQA 挑战赛的冠军解决方案
本文介绍了我们在 WSDM2023 Toloka 视觉问答(VQA)挑战赛中的冠军解决方案。利用 ViT-Adapter 和 Uni-Perceiver 进行跨模态本地化,成功地实现了通过给定的疑问句推理和定位隐含指定的物品。我们的方法在公
→
PDF
a year ago
AAAI
关系增强变换器在文本到点云定位中的应用
本文提出了一种统一的关系增强 Transformer (RET) 方法,通过使用新颖的关系增强自我关注机制和精细的跨模态匹配方法,成功地解决了文本到点云的交叉模态本地化问题,并在 KITTI360Pose 数据集上实现了比以前最先进方法更优
→
PDF
a year ago
CVPR
Text2Pos: 文本和点云跨模态定位
本文提出了一种名为 Text2Pos 的模块,可以通过文本描述来定位物件位置,可为以后基于自然语言的导航奠定基础。
PDF
2 years ago
Prev
Next