数理推理中的离群检测的轨迹波动
研究讨论了关于基于基因组序列的细菌识别的 out-of-distribution (OOD) inputs 问题,提出了用于深度生成模型的似然比方法来纠正背景统计数据偏差,并在 genomics 数据集上进行了实验。结果表明,我们的方法在 OOD 检测方面取得了最好的性能,并且我们证明了该方法的广泛适用性。
Jun, 2019
机器学习中,识别推理数据是否超出模型的预期输入分布对于给出预测的上下文至关重要。我们的研究针对基于表示或基于逻辑方法的超出分布检测方法,并提出了用于特征嵌入降维的表示方法和解决了一个问题的基于逻辑方法。我们在 OpenOODv1.5 基准框架上验证了我们方法的有效性,结果显示性能显著提升,并达到了最新的技术水平。
Jan, 2024
本文研究了如何检测机器学习模型移植到实际应用中可能出现的数据分布偏移,提出了一个以神经网络为基础的 OOD 检测方法,并结合理论与实验表现对其进行了分析与评估。
Dec, 2021
使用 Transformers,本文提出了一种针对文本型 OOD 检测的新颖变分推断框架(VI-OOD),通过有效利用预训练 Transformers 的表示,最大化联合分布 $p (x, y)$ 的似然度,从而解决了现有 OOD 检测方法中出现的问题。通过对多个文本分类任务的广泛实验,VI-OOD 展示了其高效性和广泛适用性。
Apr, 2024
通过引入图学习不变领域生成(GLIDER)的新框架,本文在节点级别的属性分布和拓扑结构分布的共同分布转变的情境下,实现了优于基准方法的节点级别 OOD 广义化跨域模型。
Mar, 2024
通过对输入数据复杂度的估计,提出了一种有效且无需参数的 OOD 分数,可以看作是一种类似于贝叶斯模型比较的似然比,用于检测和比较基于似然概率的生成模型中的异常输入数据。实验证明,该分数在各种数据集、模型和复杂度估计下具有相当的性能。
Sep, 2019
机器学习模型在非独立同分布的数据分布下表现出可疑的风险,因此需要发展算法来评估和改善模型的泛化能力以及处理分布变化的能力。本文综述了现有的非独立同分布泛化评估的研究,将其划分为三个范式:非独立同分布性能测试、非独立同分布性能预测和非独立同分布内在特性表征,并简要讨论了预训练模型的非独立同分布评价。最后,提出了未来研究的几个有前景的方向。
Mar, 2024
本文提出了一个 OOD 代理框架,统一了许多最近提出的基于似然比的方法,并指出似然比是一种原则性的 OOD 检测方法,而不是简单的方法修正。此外,还讨论了领域区分和语义之间的关系。
Oct, 2022