通过端到端最大化 KL 散度学习异常子群

Feb, 2024

通过端到端最大化 KL 散度学习异常子群

Learning Exceptional Subgroups by End-to-End Maximizing KL-divergence

Sascha Xu, Nils Philipp Walter, Janis Kalofolias, Jilles Vreeken

TL;DR使用 Syflow 方法和正则化流来寻找和描述具有异常目标特性的子群，并提供易于解释的子群描述。

Abstract

Finding and describing sub-populations that are exceptional regarding a target property has important applications in many scientific disciplines, from identifying disadvantaged demographic groups in census data

sub-populations target property syflow normalizing flows neural layer

发现论文，激发创造

使用 MDL 方法寻找数值目标的优秀子组列表

本文提出了一种基于 MDL 原则和子组列表的分散感知问题制定的子组集发现方法，提出了 SSD++ 启发式算法，能够返回具有强烈差异的均值和小变差的紧凑子组的非冗余集合。

Jun, 2020

潜变量混合的分布鲁棒损失

该研究使用凸优化方法控制给定大小的所有子人群的最坏情况表现，从而提高模型的泛化能力。实证研究表明该方法可在未知子人群中推广。

Jul, 2020

多层个性化联邦学习用于缓解学生预测分析中的偏差

本文提出了一种用于学生建模的多层个性化联邦学习 (Multi-Layer Personalized Federated Learning, MLPFL) 方法，旨在优化不同层次学生群组标准的推断准确性。该方法通过分布式训练以元梯度更新推导出团体内个人化模型，并结合多种学生行为模态，实现了个性化建模以提高跨不同学生子群组的预测准确性和稳定性。在三个真实的在线课程数据集上的实验表明，该方法在各种学生子群组中均能取得显著的预测质量改进，并为不同的学生子群组分别提取出特征聚类成果。

Dec, 2022

基于实数目标的主观有趣子群发现

该研究介绍了一种基于主观趣味性框架的方法，用于在高维数据中查找最具信息量的子组。该方法可以同时考虑多个实值目标属性，并且通过迭代数据挖掘支持知识的应用。

Oct, 2017

使用主观有趣子群及层次目标挖掘 Java 内存错误

通过 Subgroup Discovery 技术，针对企业资源规划系统（ERP）中的复杂目标概念，对发生的内存溢出问题进行数据挖掘，并提出了一种处理具有层次结构的复杂目标概念的新方法。

Oct, 2023

使用基于离散修正子群发现的方法确定关于数值数据的一致性描述

该论文介绍了一种通过乐观估计器框架进行最优子集发现的方法，该方法使用子集大小、中位数和中位数周围的离散度来确定所有函数，并且经过了广泛的实证评估，证明可以发现具有更小误差的子集。

Jan, 2017

通过睡眠专家推进子群体公平

研究在具有重叠人口和顺序预测的情况下改善对子群体的公平性的方法，并指出当多个重叠群体的目标不是平等预测而是良好预测时，满足此保证的任务并不简单，即使针对每个子群体分别提供性能良好的预测器，对于未加权的假阴性和假阳性率的简单目标而言，满足这个目标在统计上也可能是不可能的。

Sep, 2019

机器学习系统子组绩效监控的高效框架

本文提出了一个高效的框架来监测机器学习系统的子群体表现，通过使用贝叶斯优化来寻找在有限的标记数据中表现最差的数据子群体。对此框架在各种实际应用数据下进行实验，结果表明其有效地且高效地取回了表现最差的数据子群体。

Dec, 2022

MOOC 中的子群发现：描述不同类型学习者的大数据应用

本文采用基于 MapReduce 的子群发现方法对海量在线公开课（MOOC）中不同类型的学习者进行分类和描述，旨在发现出现在不同 MOOC 中的 IF-THEN 规则。实验结果表明，该方法优于传统的顺序子群发现方法，运行时几乎保持不变，发现的子群也减少了一到两个数量级。此外，发现的子群可供课程教师用于描述以及推荐或个性化任务。

Feb, 2024

SubgroupTE: 提高子群组辨识的治疗效果估计

介绍了一种名为 SubgroupTE 的新型治疗效果估计模型，该模型在治疗效果估计中加入了子组标识，通过考虑子组特定的因果效应来更精确地估计治疗效果，并通过迭代优化子组划分和治疗效果估计网络来提高估计和子组识别的性能。

Jan, 2024