- 深度学习的分层分布感知测试
本文提出了一种新的鲁棒性测试方法,考虑到输入分布和输入质量,在特征和像素级别进行分层分析,证实该方法在检测对抗性样本和改进深度学习模型鲁棒性方面比现有技术更加优越。
- 基于可激发神经元的深度学习测试框架:从过度激动到错误
为解决深度神经网络在实际应用中产生错误行为的问题,引入了基于 Shapley 值的可激励神经元概念,设计了一个名为 DeepSensor 的新颖测试框架,通过最大化与各种错误行为相关的可激励神经元数量,生成有效的测试样例,对包括图像分类模型 - 追求连续性公理
本文提出了一种替代 Kleinberg 公理化系统的算法,可以生成新的带标记的测试数据集,以用于聚类算法测试。
- 自然语言中基于属性的测试探索
本文介绍了一种利用组合范畴语法从自然语言生成可执行测试用例的方法,并且提出了一个原型系统,可以从英语描述中为基于属性的测试生成测试用例。
- AAAI分类器数据质量:一种基于几何复杂度的自动基线和见解生成方法
该研究开发了复杂度量度,可用于量化观测数据的分类复杂度并确定基准性能阈值,其有效突出可能被错误分类的数据区域和观测数据。
- ICCV场景文本识别的数据增强
该论文使用 STRAug 增强模型,包含 36 个针对场景文本图像属性的图像增强函数,有效地提高了模型对正常和不规则测试数据集的准确度。
- 全球关注焦点:COVID-19 在 Twitter 上 24 种语言相关词汇的 n-gram 时间序列
研究新冠疫情大流行期间利用社交媒体数据分析出全球不同语言中涉及 “病毒” 一词的时间序列,以及各种数据(包括社交媒体数据)的重要性,为全球疫情的控制提供有用的参考和数据支持。
- 深度神经网络的覆盖率与鲁棒性之间存在有限的相关性
通过实证研究 100 个 DNN 模型和 25 种指标,发现 DNN 的测试覆盖率与鲁棒性之间的相关性有限,即提高测试覆盖率并不能帮助提高鲁棒性。这个研究提出的数据集和实现也可以作为测试 DNN 的基准。
- 测试随机性
本文通过回顾已知的在线检验方法,重点研究基于依从性鞅的方法,强调了概念和实践方面,并阐述了有效性和效率方面的结果。
- 深度学习在图像重构中的不稳定性 - AI 是否是一种代价?
在影像重建领域,深度学习因其在图像分类等任务中的示例成功而崭露头角,但其不稳定重建方式成为一个至关重要的问题。本文提出了一种新的稳定性测试方法,并研发了易于使用的软件,旨在帮助科学家和政府机构(如美国食品和药品管理局)确保深度学习方法的安全 - Paracosm: 自动驾驶系统测试的语言与工具
Paracosm 是一种编写自动驾驶系统测试场景的反应式语言,它允许用户以编程方式描述复杂的驾驶情况,并通过游戏引擎提供逼真的物理模拟和可视化呈现,深度神经网络提供自动驾驶系统实现的测试和建模功能,可以发现错误行为或性能下降。
- 测试神经网络的输入优先级排序
本文旨在通过情感测量的方式来识别深度神经网络模型的弱点。通过三种情感测量指标:置信度、不确定性和惊奇度的比较,发现这些指标能够有效地通过对模型计算的分析来辨识出暴露 DNN 行为不当的输入。
- 通过罕见事件模拟实现可扩展的自动驾驶汽车端到端测试
开发了一种模拟框架,使用深度学习感知和控制算法来测试现代自动驾驶系统,通过自适应重要性采样方法来估计基于标准交通行为的意外概率,相对于蒙特卡洛抽样,可以提速 2-20 倍,并且比真实道路测试快 10-300 倍(P 为处理器数量)。
- 使用意外充分性引导深度学习系统测试
提出了一种新的基于训练数据行为的测试准则 —— 针对深度学习系统的惊奇足够性 (Surprise Adequacy for Deep Learning Systems, SADL), 通过对实现情况进行评估来指导其使用,该方法通过基于收集数 - 使用干预学习和测试因果模型
本文研究了因果贝叶斯网络上的测试和学习问题,并提出了有效的算法来测试两个未知因果贝叶斯网络的相似性和学习因果贝叶斯网络。
- DeepTest: 深度神经网络驱动的自动驾驶汽车自动化测试
本文介绍了 DeepTest,一个系统的测试工具,可以自动侦测潜在的导致致命碰撞的深度学习驱动车辆的错误行为,通过生成最大化激活神经元数量的测试输入,并利用现实世界变化的驾驶条件(例如雨、雾、照明条件等)来自动生成测试用例,能够发现许多在 - 高斯向量模型中稀疏性的自适应估计
该研究论文研究了高斯向量模型中的估计和测试问题,通过建立极小值分离距离和引入极小值自适应测试,实现了估计和测试,同时展示了最优算法和估计稀疏性的新方法,为各种统计模型的信号复杂度的估计提供了指导说明。
- 基于模型设计的智能物理系统中的参数时序逻辑属性挖掘
本文提出了一种针对具有多个参数的度量或信号时间逻辑(MTL 或 STL)的规范的框架,该框架可以自动地推断参数的范围,以便系统未满足属性标准。同时,我们还提供了用于多参数规范探索和可视化的算法,并且在实际工业应用引擎模型以及相关文献的例子中 - 离散分布形状约束的检验
本文主要研究了离散分布的结构性质(类),提出了一个通用的算法,可以测试各种形状约束的属性,包括单调、对数凹、t - 模态、分段多项式和泊松二项式分布。此外,对于所有考虑的情况,算法在领域大小方面具有近乎最优的样本复杂度,并且计算效率高。
- ICCV快速 R-CNN
本文提出了一种用于物体检测的快速区域卷积网络方法(Fast R-CNN),该方法采用了深度卷积神经网络对目标建议进行高效分类,相较于之前的方法,在提高检测精度的同时,大幅提高了训练和测试的速度。