- 概率分类器上的 Shapley 值
本文提出了一种概率 Shapley 值(P-Shapley),通过构建一个基于概率分类器的类概率效用函数来量化每个数据点对概率分类器的边际贡献,并提供几种置信度校准的激活函数,从而实现评估数据重要性以构建高可用性和可信赖性 ML 模型的目的 - 新数据的新方法?人力资源管理研究中量化归纳方法的概述和说明
数据驱动方法在人力资源管理中的应用:本文首先概述了用于人力资源管理研究的数据驱动方法,然后提出了一个探索性研究的实证例子,结合了潜在分类分析和高斯图形模型的探索方式。
- 数据估值:机器学习的部分序数 Shapley 值
本文研究了抽象代数中通过群论定义偏序 Shapley 价值的概念及其在数据合作中的角色。提出了三种算法来近似计算该价值,其中包括基于经典 Shapley 价值算法的截断蒙特卡罗算法,以及基于同一类中数据点提供类似信息这一事实的蒙特卡罗和截断 - 分散学習中的可擴充數據點評估
本文介绍了一种基于 DDVal 的去中心化数据估值方法,该方法能够对联合学习和群智学习中的单个数据点进行估值,并且可以绘制出关于机构贡献的层次性结论,准确度比现有的 Shapley 值近似方法更高,适用于分布式系统,尤其适用于具有少量大量数 - ICLRLAVA: 无需预先指定学习算法的数据估值
本文介绍了一种新的数据估值框架,可以在不确定具体学习算法的情况下对数据进行估值,并提出了基于 Wasserstein 距离和敏感性分析的方法来估值,可以检测低质量的数据并在性能方面显著提高。
- 基于匹配的生成模型数据估值
通过相似度匹配的角度,提出了 Generative Model Valuator (GMValuator) 来作为深度生成模型的第一种模型无关方法,为生成任务提供数据估值策略。此方法是第一种提供无需训练即可进行数据估值的深度生成模型的策略。
- 数据 - OOB: 作为简单高效数据价值的袋外估计
提出了一种名为 Data-OOB 的新数据评估方法,利用袋装模型的袋外估计,它具有高效的计算性能和可扩展性,可以在大型数据集上进行评估,并且表现出色优于现有的数据评估方法,对于识别有帮助或有害的数据点在实际应用中具有潜在的应用价值。
- 关于 “最近邻算法有效的任务特定数据估值” 的注记
本文提出了新的软标签 KNN-SV 算法,该算法使用更自然、更可解释的效用函数,通过基于局部敏感哈希(LSH)的高效逼近算法,实现了对 KNN 分类器 / 回归器的数据 Shapley 的计算。实验证明,Soft-label KNN-SV - 将数据 Shapley 交互计算从 O (2^n) 优化至 O (t n^2)—— 以 KNN 模型为例
本文提出了一种名为 STI-KNN 的算法,可在 O (t n^2) 时间内计算 KNN 模型的精确对交互 Shapley 值,并有效且准确地评估个体数据点的价值,从而提高人工智能应用的效果。
- ICLR监督学习的公平感知数据估值
FADO 是一个数据评估框架,旨在将公平性考虑到与机器学习相关的任务(如数据预处理、探索性数据分析、主动学习)中,采用基于熵的数据估值指标来最大化性能和公平性,可作为不公平性缓解预处理技术的基础,对于质量较好的数据具有重要意义。
- 基于 Shapley 值的算法公平性数据重新加权方法 FairShap
本文提出了一种新颖且可解释的预处理方法 FairShap,用于通过数据估值实现公平的算法决策。FairShap 基于 Shapley Value 框架,并通过测量每个训练数据点对预定义公平度量的贡献来实现可解释性。我们在多个不同性质、不同训 - 关于 “基于 Shapley 值的高效数据估值方法” 的注释
本文提出一种改进的 Shapley Value 估计算法,介绍了其分析和设计的改进选择,着重研究了数据估值的有效估算方法所面临的挑战。
- ICLR无需训练模型的数据估值
本文提出了一种基于数据的分数,称为复杂度差距分数,它是一个训练无关的数据估价分数,可以量化个体实例在两层过度参数化神经网络的泛化中的影响,并用于分析数据集和诊断训练动态。
- 任务 - 不可知数据估值基础
本研究通过查询卖家的信息,估算数据的多样性和相关性,使买家能够在没有真实数据的情况下对数据进行评估和购买。
- AAAI通过合成数据奖励激励机器学习合作
本文提出了一种新的协作生成建模 (CGMO) 框架,通过使用最大均值差 (MMD) 数据估价函数和线性优化问题作为奖励计划,来激励个体之间的协作,将合成数据作为奖励分配给这些个体,同时保证合理的激励机制。
- 使用 Shapley 值对医疗成像数据进行估值:在大规模胸部 X 射线数据集上的应用
本研究使用数据 Shapley 方法评估了训练数据对大型胸部 X 射线数据集中肺炎检测算法性能的价值,发现具有高 Shapley 值的训练数据对于肺炎检测很重要,该方法可作为去除医学影像数据中的噪音的框架。
- 应用强化学习进行数据价值评估
提出了一种基于强化学习的数据估值元学习框架,可以同时学习数据价值和目标任务预测模型,能够在不同类型的数据集和应用场景中,显著提高数据价值估计精度,并在检测错误样本、领域自适应和稳健学习等方面比现有方法表现更出色。
- 最近邻算法高效任务特定数据价值评估
本文提出一种用 Shapley value 计算数据相对价值的方法,特别是在 KNN 算法中,能够以较低的速度准确计算数据相对价值。
- 数据 Shapley: 机器学习数据的公平估值
本研究提出一种考虑数据公正价值的方法,通过估算数据 Shapley 值来解决在监督学习中评估数据价值的困难,并且发现该方法优于其他流行的评估方法,可以有效提高预测器的性能。