可定制扰动合成用于鲁棒性 SLAM 基准测试
我们提出了一种新颖的、可定制的噪声数据合成管道,旨在评估多模态 SLAM 模型对各种干扰的弹性,通过使用所提供的工具箱,将清洁环境转化为具有挑战性的噪声模拟。使用该管道,我们构建了大规模 Noisy-Replica 基准,并评估现有高级 RGB-D SLAM 模型对多种干扰类型的风险容忍度。
Jun, 2024
本研究评估了引用感知模型对各种扰动在通用和特定情境下的鲁棒性,提出了扰动的综合分类,并开发了一个多功能工具箱来合成和评估复合扰动的影响。通过该工具箱,构建了一个评估引用感知模型对嘈杂条件下的健壮性的基准,同时还提出了一种基于语言模型的代理机制,通过自然语言指令简化和自动化模型评估。研究揭示了当前引用感知模型在各种扰动下的弱点,并提供了评估模型鲁棒性的工具,有望促进智能系统安全、鲁棒地融入复杂现实场景。
Mar, 2024
通过对大型语言模型(LLMs)进行系统的鲁棒性评估,本研究提供了关于 LLMs 对多样化和噪声输入的处理能力方面的进一步改进的见解。
Jun, 2024
本文对 RGB-D SLAM 进行了可行性研究,通过 ORBSLAM2 等视觉 SLAM 方法在公开数据集和自行构建的 HomeRobot 数据集上进行实验,发现它们在很多情况下可以取得很好的精度,但健壮性仍然是一个问题。
Oct, 2019
介绍了 RoTBench,用于评估工具学习中 LLMs 的鲁棒性的多级基准。通过在五个不同级别的噪声环境下进行实验,揭示了现有模型在工具选择、参数识别和内容填充三个关键阶段中的弹性问题。为了增强 LLMs 在工具学习中的鲁棒性,提出了 RoTTuning 策略。
Jan, 2024
该论文介绍了一个软件框架 SLAMBench,通过实验研究不同的实现和算法在 RGB-D SLAM 系统性能、精度和能耗等方面的权衡,并提供了多个平台上的执行时间和能效分析结果。
Oct, 2014
探讨语言模型对输入扰动的敏感性以及通过不同训练策略来提高模型性能和鲁棒性的方法,通过在 Tabular-NLI 任务中的实例验证了该模型可对抗不同的扰动而不降低准确性。
Nov, 2023
本研究旨在评估几种常见基线以及两种环境感知模型在自动驾驶中进行准确且稳健的车道预测的表现,结果发现训练过程中加入与实际部署场景相似的扰动可以有效减少性能下降,但仍无法保证对未知的干扰具有鲁棒性,甚至有时降低输入噪声反而有助于提高预测准确性。
Apr, 2023
本研究针对物体检测模型在实际应用中所面临的实际分布转移困境,探讨了通过模拟自然干扰(如光照、模糊和亮度的变化)及相应的数据增强技术来评估和提高模型的鲁棒性。经过综合的剖析研究及实验,发现使用数据增强技术中的合成干扰可以有效提高模型的鲁棒性,并提供了相应的实测核实数据及有价值的洞察力。
Apr, 2023