- 探索基于能量模型的方言识别的非分布检测
本研究介绍了一种针对方言的新型边界增强联合能量模型(MEJEM),用于方言中的 OOD 检测。通过集成生成模型和能量边界损失,我们的方法旨在增强方言识别系统的鲁棒性。此外,我们探索了两种 OOD 得分的方言检测方法,研究结果明确表明能量得分 - OAML:用于 OOD 检测增强的异常值感知度量学习
我们提出了一种名为 Outlier Aware Metric Learning (OAML) 的框架,通过 k-NN 算法和稳定扩散模型在特征级别生成用于训练的异常样本,以提高语义空间中的特征差异,并结合基于互信息的对比学习方法,有效地利用 - 一种以速率 - 失真为视角的不确定性量化方法
本论文介绍了一种名为 DAB(Distance Aware Bottleneck)的新方法,用于通过学习一个代码本,丰富深度神经网络的性质,从而提供确定性不确定性评估,达到更好的异常检测和误分类预测结果。
- GROD:利用外部分布检测增强 Transformer 的泛化性能
基于 OOD 检测的 Generate Rounded OOD Data (GROD) 算法通过惩罚 OOD 数据的错误分类和生成合成异常值来增强 Transformer 网络在各种任务上的泛化性能,并在不同数据类型的 NLP 和 CV 中 - 早期疾病发生预测中的数据集偏移问题的外部拒绝选项方法
该研究提出了一种名为 Odrop 的方法,结合了 OOD 检测模型,并在健康和医疗数据中应用 OOD 检测,以减少数据集偏移对疾病预测准确性的影响。
- CLIPScope:用贝叶斯评分增强零样本 OOD 检测
CLIPScope 是一种零样本 OOD 检测方法,通过类似 Bayesian 后验更新的方式归一化样本的置信度得分,并利用大型词汇数据库挖掘最远和最近于 ID 类的类标签,以最大化覆盖 OOD 样本,经过广泛的消融研究和实证评估,展示了 - 通过捕捉极端激活来减轻对于外部分布检测中的过度自信
通过测量神经网络次最后一层的极端激活值并利用这一特征改进各种 OOD 检测基线,我们解决了模型 “过度自信” 现象造成的 OOD 检测问题,在各类实验中得到了显著提升,不损害任何场景的性能。
- 基于能量的 Hopfield Boosting 用于离群检测
采用先进的训练策略,利用辅助离群数据训练机器学习模型以改善在真实世界中的离群检测性能。通过引入 Hopfield Boosting 算法,利用现代 Hopfield energy (MHE) 技术加强了模型在内部分布数据和辅助离群数据之间的 - 分子图中优化 OOD 检测:利用扩散模型的新方法
通过采用基于辅助扩散模型的框架,我们提出一种检测异常分子的方法,其中比较输入分子和重构图之间的相似性,并通过生成模型中的迭代去噪过程以有效量化匹配度,构建符合正常分子但远离异常分子的典型图,并使用高效可扩展的异常检测器,比较测试样本与预先构 - ECCV梯度正则化的离群样本检测
利用损失函数的梯度信息进行训练,实现神经网络在离分布数据上的检测,并通过能量采样方法提高模型性能。
- 通过正则化、置信度最小化和选择性推断校准贝叶斯学习
本研究介绍了一种基于变分推断的贝叶斯学习方法,通过集成校准、置信度最小化和选择性校准来增强人工智能模型的可靠性和决策效果。数值结果表明,相较于现有技术,该方法在识别内部数据、校准内部数据和校准外部数据方面取得了最佳结果,但同时需要拒绝部分输 - 重新思考强化学习的非分布检测:改进评估和检测方法
我们提出一种基于时间序列特征提取的新方法 DEXTER,用于检测强化学习中的异常情况,该方法在基准场景中表现出优越性能,相比现有的异常检测算法和高维度变点检测方法具有显著优势。
- 离群数据:对抗样本的熟悉 —— 综述
深度神经网络在现实应用中会遇到来自分布失真和对抗性攻击的数据,本综述聚焦于这两个领域的交叉研究,探讨如何通过鲁棒的分布失真检测和统一的鲁棒性进行对抗性攻击和对分布失真数据的健壮处理。
- CVPR学习可转移的负提示用于超出分布检测
通过负面提示学习,在 ID 和 OOD 图像之间界定边界,以解决存在于开放词汇学习场景中的高误报率,超越了现有的基于提示学习的 OOD 检测方法,并在闭合和开放词汇分类场景中保持了一致优势。
- 似然异常检测悖论的几何解释
概率估计的深度生成模型在处理复杂数据集时,尽管给较简单来源的数据分配了较高的概率值,但却没有生成这些数据,这个矛盾仍然没有得到解释,因此概率估计的 OOD 检测不可信。我们的研究观察到,当高概率区域中包含的概率质量最小时,这些区域将不会生成 - 特征空间中的能量校正模型用于异常数据检测
该论文通过使用预训练深度分类器的特征空间研究了离群分布(OOD)检测问题,发现使用基于能量模型(EBM)学习内部分布特征的密度可以获得有竞争力的检测结果,并通过能量校正与类条件高斯分布的混合来解决 MCMC 采样非混合化的问题,相较于 CI - 通过不确定性量化从量化网络中提取可用的预测结果进行 OOD 检测
使用不确定性量化技术对预训练视觉模型进行预测不确定性估计,以提取有价值的预测并忽略不自信的预测,从而避免最多 80% 的被错误分类的样本。
- LLM-Detector: 优化 AI 生成的中文文本检测的开源 LLM 指令调优
本文提出了 LLM-Detector 方法,通过 LLM 指导和解决文档级和句子级的文本检测问题,该方法在句子级和文档级文本检测上明显优于基准方法,并展示了强大的泛化能力。
- ICLR面向外部分布检测的最佳特征塑造方法
特征整形方法用于提高模型在不同类别外样本检测方面的性能,本研究提出一种抽象的优化框架和具体的基于分段常数形状函数的特征整形方法,通过仅利用内部数据,优化该函数,从而在多种数据集和模型架构上提高了模型的泛化能力。
- 基于最优输运的条件分布熵检测异常样本
通过建立优化方程,利用训练样本和测试输入的几何信息,提出了一种无需依赖分布假设、先验知识和特定训练机制的新型距离方法,用于在存在测试输入的情况下,有效利用分布信息来判断样本是否为来自分布之外的样本,并在基准数据集上展开的大量实验证明了该方法