可定制扰动合成用于鲁棒性 SLAM 基准测试

Feb, 2024

可定制扰动合成用于鲁棒性 SLAM 基准测试

Customizable Perturbation Synthesis for Robust SLAM Benchmarking

Xiaohao Xu, Tianyi Zhang, Sibo Wang, Xiang Li, Yongqi Chen...

TL;DR我们提出了一个用于评估多模态 SLAM 模型对各种扰动的鲁棒性的新型、可定制的噪声数据合成流程，并利用此流程实例化了 Robust-SLAM 基准，揭示了现有 SLAM 模型在真实世界干扰下的易感性。

Abstract

robustness is a crucial factor for the successful deployment of robots in unstructured environments, particularly in the domain of Simultaneous Localization and Mapping (SLAM). Simulation-based benchmarks have emerged as a highly scalable approach for →

robustness simultaneous localization and mapping noisy data synthesis perturbation taxonomy slam models

发现论文，激发创造

从完美到嘈杂的世界模拟：用于 SLAM 鲁棒性评估的可定制的多模态干扰

我们提出了一种新颖的、可定制的噪声数据合成管道，旨在评估多模态 SLAM 模型对各种干扰的弹性，通过使用所提供的工具箱，将清洁环境转化为具有挑战性的噪声模拟。使用该管道，我们构建了大规模 Noisy-Replica 基准，并评估现有高级 RGB-D SLAM 模型对多种干扰类型的风险容忍度。

Jun, 2024

R^2-Bench: 参照感知模型在干扰下的鲁棒性基准测试

本研究评估了引用感知模型对各种扰动在通用和特定情境下的鲁棒性，提出了扰动的综合分类，并开发了一个多功能工具箱来合成和评估复合扰动的影响。通过该工具箱，构建了一个评估引用感知模型对嘈杂条件下的健壮性的基准，同时还提出了一种基于语言模型的代理机制，通过自然语言指令简化和自动化模型评估。研究揭示了当前引用感知模型在各种扰动下的弱点，并提供了评估模型鲁棒性的工具，有望促进智能系统安全、鲁棒地融入复杂现实场景。

Mar, 2024

RUPBench：基于干扰的推理鲁棒性评估大型语言模型的基准测试

通过对大型语言模型（LLMs）进行系统的鲁棒性评估，本研究提供了关于 LLMs 对多样化和噪声输入的处理能力方面的进一步改进的见解。

Jun, 2024

LLM 的输入扰动问题重新审视：噪声槽填充任务的统一鲁棒性评估框架

使用大型语言模型来评估对话理解能力，在输入扰动场景下提高扰动稳健性表现。

Oct, 2023

视觉 SLAM 的鲁棒性测量

本文对 RGB-D SLAM 进行了可行性研究，通过 ORBSLAM2 等视觉 SLAM 方法在公开数据集和自行构建的 HomeRobot 数据集上进行实验，发现它们在很多情况下可以取得很好的精度，但健壮性仍然是一个问题。

Oct, 2019

RoTBench: 评估大型语言模型在工具学习中的鲁棒性的多层级基准测试

介绍了 RoTBench，用于评估工具学习中 LLMs 的鲁棒性的多级基准。通过在五个不同级别的噪声环境下进行实验，揭示了现有模型在工具选择、参数识别和内容填充三个关键阶段中的弹性问题。为了增强 LLMs 在工具学习中的鲁棒性，提出了 RoTTuning 策略。

Jan, 2024

SLAMBench：一个用于 SLAM 性能和准确性基准测试的方法论介绍

该论文介绍了一个软件框架 SLAMBench，通过实验研究不同的实现和算法在 RGB-D SLAM 系统性能、精度和能耗等方面的权衡，并提供了多个平台上的执行时间和能效分析结果。

Oct, 2014

多集合免疫接种：跨多个挑战集评估模型的稳健性

探讨语言模型对输入扰动的敏感性以及通过不同训练策略来提高模型性能和鲁棒性的方法，通过在 Tabular-NLI 任务中的实例验证了该模型可对抗不同的扰动而不降低准确性。

Nov, 2023

用于自动驾驶的道路用户轨迹预测模型的鲁棒性基准测试

本研究旨在评估几种常见基线以及两种环境感知模型在自动驾驶中进行准确且稳健的车道预测的表现，结果发现训练过程中加入与实际部署场景相似的扰动可以有效减少性能下降，但仍无法保证对未知的干扰具有鲁棒性，甚至有时降低输入噪声反而有助于提高预测准确性。

Apr, 2023

增强物体检测可靠性：一种基于合成和自然扰动的方法

本研究针对物体检测模型在实际应用中所面临的实际分布转移困境，探讨了通过模拟自然干扰（如光照、模糊和亮度的变化）及相应的数据增强技术来评估和提高模型的鲁棒性。经过综合的剖析研究及实验，发现使用数据增强技术中的合成干扰可以有效提高模型的鲁棒性，并提供了相应的实测核实数据及有价值的洞察力。

Apr, 2023