- 神经网络中利用吸引子的鲁棒图像分类在存在外部分布和对抗样本的情况下
在面对高干扰水平的离群样本和对抗性攻击时,通过利用训练样本作为吸引子训练全连接神经网络,可以提高网络的稳健性和对离群样本的识别能力,从而实现稳健分类,证实其在高度干扰的 MNIST 测试数据上达到 87.13% 的准确率,并以 98.84% - ICML利用大型语言模型对异常样本曝光进行预测以进行离群检测
通过利用大型语言模型的专业知识和推理能力,我们提出了一种名为 “Envision potential Outlier Exposure”(EOE)的方法,可以在没有访问任何真实 OOD 数据的情况下,通过视觉相似性生成潜在异常类标签并设计有 - MultiOOD:多模态下的扩展外分布检测
通过引入多模态 OOD(Out-of-Distribution)检测基准 MultiOOD,本研究评估了现有的单模态 OOD 检测算法,并提出了 Agree-to-Disagree(A2D)算法和 NP-Mix 异常值合成方法,通过利用多模 - CLIPScope:用贝叶斯评分增强零样本 OOD 检测
CLIPScope 是一种零样本 OOD 检测方法,通过类似 Bayesian 后验更新的方式归一化样本的置信度得分,并利用大型词汇数据库挖掘最远和最近于 ID 类的类标签,以最大化覆盖 OOD 样本,经过广泛的消融研究和实证评估,展示了 - 朝着外部分布检测的现实基准
深度神经网络在各种技术和服务中得到越来越广泛的应用,但其容易受到来自训练集不同分布的样本的干扰,而常见的解决方法是使深度神经网络具备检测这种样本的能力。本文提出了一种基于 ImageNet 和 Places365 的全面评估标准,根据与训练 - ICLR克服视觉语言模型微调的问题:针对 OOD 泛化
在本论文中,我们首先展示了,经过足够时间的微调但没有适当的正则化,视觉 - 语言模型在给定数据集中往往会过度拟合已知类别,导致对未知类别的表现下降。然后,我们提出了一种新颖的方法 OGEN 来解决这个问题,在关注点主要是改进经过微调模型的未 - AAAI马哈拉诺比斯感知训练用于外部分布检测
在本研究中,我们提出了一种新的损失函数和网络训练方法,以提高密度感知的开放世界环境中对异常和越界样本的检测能力,并在 CIFAR-10 数据集上进行了验证,将相对马氏距离方法在远距离越界任务中的错误正例率降低了 50% 以上。
- 低维度梯度有助于外部分布检测
通过对梯度信息进行线性降维,结合现有的检测评分函数,我们的方法在各种检测任务中展示了卓越的性能,例如在 ImageNet 基准测试中,我们的方法相较于当前最先进方法,在 95% 召回率时,假阳性率平均减少了 11.15%。
- ICML推断相互作用系统中的关系潜能
建议提出了神经交互推断(NIIP)作为发现系统相互作用的替代方法,其灵活性更大,并具备对轨迹建模、添加外部约束以及异常检测的能力。
- 复合能力呈现出乘法效应:在合成任务上探索扩散模型
通过对条件扩散模型的控制实验研究,我们发现生成模型在组合推理任务上的性能是突然出现的,其组合能力取决于底层数据生成过程的结构,并在生成非分布样本时需要更多的优化步骤。
- 使用扩散模型进行未见图像合成
通过使用预训练和冻结的去噪扩散概率模型 (DDPM) 来逆向编码并优化隐藏域,从未见过的域图像合成,证明了这种新颖视角探索和重新思考扩散模型的数据合成广义能力的有效性。
- ICCV最近邻导引的带外分布检测
检测开放环境中机器学习模型的异常样本是至关重要的。通过引入最近邻引导(NNGuide)方法,我们解决了由于边界几何导致的分类器评分过分自信的问题,同时保持了分类器评分的细粒度能力,并在多种设置下,包括 ID 数据自然分布变化的情况下,在 I - 原型分裂:稳健开放式半监督学习的闭环方法
通过原型分裂 (Prototype Fission,PF) 将类别潜空间分为紧凑的子空间,由粗粒度标签驱动自动细粒度潜空间挖掘,以关闭内部分布集,从而提高半监督学习中对 OOD 样本的拒绝率。
- 朝着具有 CLIP 的逼真无监督微调
通过将视觉语言模型 (VLMs) 应用于下游监督学习任务,本文探讨了无监督微调 CLIP 模型,解决了未知类别的样本和识别预定义类别实例的问题,并提出了一种称为通用熵优化 (UEO) 的简单有效的微调方法。通过广泛的实验,我们证明了 UEO - 基于马氏距离的非监督式外部方言检测
我们提出了一个简单而有效的无监督马氏距离特征方法,在流行的 wav2vec 2.0 变换器式方言分类器模型的所有中间层的潜在嵌入上进行多任务学习,用于检测超出分布的样本,并在 OOD 检测方法方面显著优于其他最先进的方法。
- 重塑三维医学图像的异常检测
通过使用 Expected Performance Drop (EPD) 作为新问题设计的核心贡献,我们重新定义了医学图像分割中的异常检测问题,该方法在 11 个 CT 和 MRI OOD 检测挑战中展示了其有效性。
- 利用去噪扩散概率模型检测面部混合攻击
本文介绍了一种基于扩散的新型高效 MAD 方法,学习纯粹的真实图像的特征,实现对不同形态的变形攻击的检测。在四个不同数据集上进行了严格的实验,并与现有解决方案进行了比较,结果表明我们的 MAD 模型在所有数据集上都取得了高竞争力的结果。
- GVdoc:基于图形的视觉文档分类
GVdoc 是一种基于图的文件分类模型,通过生成文档图并使用图神经网络学习节点和图嵌入,在保持良好性能的同时,比同类模型更好地解决了处理识别图形文档的挑战,能够在识别数据稀疏的情况下表现出色。
- 从损失函数中分离分位数表示
本文中,我们介绍了一种同时二元分位数回归(SBQR)的技术,可以独立于损失函数构建分位表示,对于检测越界样本和校准模型等问题具有优越性。
- 基于布局引导的图像生成的诊断基准和迭代修复
本文提出了 LayoutBench 和 IterInpaint 两个基于互补技术的图像布局与生成模型,旨在解决现有模型在处理任意或未见过的图像布局方面的不足,同时在四个空间控制技能方面进行定量和定性评估。