数理推理中的离群检测的轨迹波动

May, 2024

数理推理中的离群检测的轨迹波动

Trajectory Volatility for Out-of-Distribution Detection in Mathematical Reasoning

Yiming Wang, Pei Zhang, Baosong Yang, Derek F. Wong, Zhuosheng Zhang...

TL;DR提出了一种基于轨迹的方法 TV score，通过使用轨迹的波动性进行数学推理中的离群数据检测，实验证明该方法在数学推理场景下优于传统算法，并可扩展到输出空间具有高密度特征的更多应用，如多项选择题。

Abstract

real-world data deviating from the independent and identically distributed (i.i.d.) assumption of in-distribution training data poses security threats to deep networks, thus advancing out-of-distribution (OOD) detection algorithms. Detection methods in →

real-world data out-of-distribution detection generative language models embedding-based methods trajectory-based method

发现论文，激发创造

用于识别样本分布外点的似然比

研究讨论了关于基于基因组序列的细菌识别的 out-of-distribution (OOD) inputs 问题，提出了用于深度生成模型的似然比方法来纠正背景统计数据偏差，并在 genomics 数据集上进行了实验。结果表明，我们的方法在 OOD 检测方面取得了最好的性能，并且我们证明了该方法的广泛适用性。

Jun, 2019

全面的 OOD 检测改进

机器学习中，识别推理数据是否超出模型的预期输入分布对于给出预测的上下文至关重要。我们的研究针对基于表示或基于逻辑方法的超出分布检测方法，并提出了用于特征嵌入降维的表示方法和解决了一个问题的基于逻辑方法。我们在 OpenOODv1.5 基准框架上验证了我们方法的有效性，结果显示性能显著提升，并达到了最新的技术水平。

Jan, 2024

针对超出分布检测的可证明保障

本文研究了如何检测机器学习模型移植到实际应用中可能出现的数据分布偏移，提出了一个以神经网络为基础的 OOD 检测方法，并结合理论与实验表现对其进行了分析与评估。

Dec, 2021

VI-OOD：文本外分布检测的统一表示学习框架

使用 Transformers，本文提出了一种针对文本型 OOD 检测的新颖变分推断框架（VI-OOD），通过有效利用预训练 Transformers 的表示，最大化联合分布 $p (x, y)$ 的似然度，从而解决了现有 OOD 检测方法中出现的问题。通过对多个文本分类任务的广泛实验，VI-OOD 展示了其高效性和广泛适用性。

Apr, 2024

图形在分布偏移下的泛化

通过引入图学习不变领域生成（GLIDER）的新框架，本文在节点级别的属性分布和拓扑结构分布的共同分布转变的情境下，实现了优于基准方法的节点级别 OOD 广义化跨域模型。

Mar, 2024

梯度正则化的离群样本检测

利用损失函数的梯度信息进行训练，实现神经网络在离分布数据上的检测，并通过能量采样方法提高模型性能。

Apr, 2024

利用基于似然的生成模型进行输入复杂度和越界检测

通过对输入数据复杂度的估计，提出了一种有效且无需参数的 OOD 分数，可以看作是一种类似于贝叶斯模型比较的似然比，用于检测和比较基于似然概率的生成模型中的异常输入数据。实验证明，该分数在各种数据集、模型和复杂度估计下具有相当的性能。

Sep, 2019

处理图上的分布偏移：一个不变性的视角

本文提出了一种基于不变性学习和风险最小化的方法，实现图神经网络对于图结构数据上的越域通用性问题进行预测和预测不确定性的估计。

Feb, 2022

关于外分布泛化评估的调研

机器学习模型在非独立同分布的数据分布下表现出可疑的风险，因此需要发展算法来评估和改善模型的泛化能力以及处理分布变化的能力。本文综述了现有的非独立同分布泛化评估的研究，将其划分为三个范式：非独立同分布性能测试、非独立同分布性能预测和非独立同分布内在特性表征，并简要讨论了预训练模型的非独立同分布评价。最后，提出了未来研究的几个有前景的方向。

Mar, 2024

机器学习研究人员关于 OOD 检测的错误信念

本文提出了一个 OOD 代理框架，统一了许多最近提出的基于似然比的方法，并指出似然比是一种原则性的 OOD 检测方法，而不是简单的方法修正。此外，还讨论了领域区分和语义之间的关系。

Oct, 2022