开放世界学习及其在产品分类中的应用
综合研究开放环境下机器学习的未知拒绝、新类别发现和类别自适应学习等方面,探讨了当前方法的挑战、原则和限制,以及未来研究的潜在方向。旨在全面介绍新兴的开放环境机器学习范式,帮助研究人员在各自领域构建更强大的人工智能系统,并促进人工通用智能的发展。
Mar, 2024
这篇论文在机器学习领域做出了重要贡献,特别是在面对前所未见的数据和情境的开放世界情况下。通过研究开放世界机器学习中的 Out-of-distribution (OOD) Detection 和 Open-world Representation Learning (ORL) 两个关键步骤,该论文提出了算法解决方案和理论基础,为构建性能卓越且在不断变化的复杂实际世界中可靠的机器学习模型铺平了道路。
Oct, 2023
该论文研究开放世界分类问题,提出一种联合开放分类模型,该模型可以通过远距离测量函数识别未知类别的被拒绝的测试样本,并应用于聚类分析中,从而实现对未知类别的识别。
Jan, 2018
研究了在实际场景中半监督学习的一个基本局限性,即未标注的测试数据往往包含以前在标注训练数据中遇到的类。为了解决这个问题,提出了 ORCA,一种端到端的深度学习方法来处理未知类别在标注和未标注数据中的不一致性,并在图像分类数据集和单细胞注释数据集上实验,表明在 ImageNet 数据集上 ORCA 对于已知类别的改善为 25%,对于未知类别的改善为 96%。
Feb, 2021
本文介绍了一种使用深度神经网络的增强开放式分类过程,通过对无类别数据进行聚类识别新类别并重新训练分类器从而将模型转移到增量学习模型。多次实验均表明该模型的优秀性能。
Oct, 2019
本文针对开放世界机器学习系统,测试其在各种条件下的可靠性,并发现在组件的选择方面,包括原始数据、模型体系结构和 OOD 数据等选择均严重影响 OOD 检测的性能,可能引起超过 70%的误检率,而对于包含 22 种非故意损坏或对抗性扰动的 OOD 输入,误报率可以达到 100%,并提出了结合鲁棒分类器和 OOD 检测技术来解决 OOD 检测和适应性之间的新的权衡。
Jul, 2020
通过引入簇 - 匹配策略和面向跨域开放世界发现设计的目标,CROW 通过在稳定的表示空间中强大地匹配簇和之前见过的类别,从而发现新类别,并通过针对跨域开放世界发现设计的目标来精细调整表示空间,实验结果表明 CROW 在图像分类基准数据集上优于其他基线方法,在 75 个实验设置中平均提高了 8%的性能。
Jun, 2024
通过对线性变换特征空间距离单调递减函数的和进行分组来解决 “开放空间风险” 和经验风险之间的平衡,提出了开放世界识别问题,提出了一种用于评估开放世界识别系统的协议,并演示 Nearest Non-Outlier 算法如何可靠有效地处理大规模的图像数据集。
Dec, 2014
开放环境识别(OWR)是一个新兴领域,使得机器学习模型能够拒绝未知样本,并进行管理,逐步将新样本添加到基础知识。本研究提出了一个评估协议,用于估计模型在内域未知类和外域未知类之间分离能力,通过传统迁移学习、自动化机器学习(AutoML)和最近类均值(NCM)分类器与 First Integer Neighbor Clustering Hierarchy(FINCH)相结合的方法,通过对垃圾、食品、狗、植物和鸟类等五个不同领域进行实验,结果表明所有方法都可以作为一个良好的准确性基线,并且预训练模型的平衡准确率(BACCU)得分有可能在一个或多个感兴趣领域中表现出色,同时强调了预训练模型中的有效表示对于识别相同领域的未知类很重要,进一步拓展了开放环境识别在领域特定任务中的应用前景。
Dec, 2023