基于双编码器的检测器用于识别未知分布
该论文提出了一种基于对比学习的框架,旨在有效地进行 out-of-distribution 检测,利用预训练的语言模型吸收丰富的信息,并在意图分类和异常检测等数据集中取得了显著的效果。
Oct, 2022
机器学习中,识别推理数据是否超出模型的预期输入分布对于给出预测的上下文至关重要。我们的研究针对基于表示或基于逻辑方法的超出分布检测方法,并提出了用于特征嵌入降维的表示方法和解决了一个问题的基于逻辑方法。我们在 OpenOODv1.5 基准框架上验证了我们方法的有效性,结果显示性能显著提升,并达到了最新的技术水平。
Jan, 2024
机器学习模型在现实世界的医疗系统中可靠地运用和避免在分布之外的数据上产生不准确的预测是非常重要的。该研究提出了一个全面的可复现基准测试,比较了不同方法在接近和远离分布之外的数据上的表现,特别关注医疗表格数据的处理。研究发现对于远离分布之外的数据,问题似乎已经解决,但对于接近分布之外的数据仍然存在挑战。此外,将后处理方法与基于距离的机制结合可以显著改善性能,而 Transformer 架构相对于 MLP 和 ResNet 架构来说更加保守。
Sep, 2023
通过对大型语言模型进行实证研究,本文发现余弦距离的异常检测器表现出卓越的效力,优于其他异常检测器,并通过强调大型语言模型嵌入空间的各向同性特征,提供了对这一现象的有趣解释,进一步增强了我们对大型语言模型在检测异常数据方面的适应性和可靠性。
Aug, 2023
本研究提出了一种新的框架,Bi-Encoder-Decoder (BED),用于解决规范化关系提取中的实体信息利用、新实体表示、性能提升等问题。实验结果表明,该方法在两个数据集上性能显著优于之前的最优方法,并能够良好处理新实体而无需重新训练。
Dec, 2023
该论文提出了一种名为 OODformer 的新型 OOD 检测架构,利用 transformer 的上下文能力来区分内部分布和 OOD 样本,通过视觉注意力利用上下文嵌入提高了分类的通用性,在 CIFAR-10 /-100 和 ImageNet30 上取得了新的最先进成果。
Jul, 2021
采用扩散过程将提供整个训练集的信息纳入预测的噪声向量中,并推导出噪声向量的闭合解,将噪声向量转化为用于度量 OOD 的得分。通过在 OOD 基准测试上对比深度模型预测的噪声向量和闭合解噪声向量的表现,我们的方法在所有类型的图像编码器中胜过以前的 OOD 方法,其中使用 MAE-based 图像编码器达到了 3.5%的性能提升,并且通过应用不同类型的图像编码器来研究 OOD 方法的健壮性,我们的方法在所有图像编码器中表现出良好的鲁棒性。
Jan, 2024
利用多模态模型 CLIP 编码的图像和文本表示的余弦相似度作为一种新的表示,以改善用于视觉异常检测的潜在编码的透明性和可控性。通过与仅能产生用户无意义的潜在表示的现有预训练编码器进行比较,我们的实验表明,基于语言的潜在表示比传统视觉编码器的表示更好,并在与标准表示相结合时有助于提高检测性能。
May, 2024
通过对大量的异常数据进行实验比较,我们发现基于特征的异常检测方法中,多层方法始终表现优异,而单层方法的性能不稳定且取决于异常类型,同时异常检测的性能也高度依赖于神经网络的架构。
Jul, 2023
基于重构误差,我们提出了一种检测 encoder-decoder 深度估计模型中的 out-of-distribution 图像的方法,并通过实验证明其在不同模型上的性能优于现有的不确定性估计方法,而无需修改已训练的 encoder-decoder 深度估计模型。
Aug, 2023