Feb, 2024
逻辑回归的可证明准确性随机抽样算法
A Provably Accurate Randomized Sampling Algorithm for Logistic
Regression
TL;DR在统计学和机器学习领域,逻辑回归是一种广泛应用于二分类任务的监督学习技术。本研究提出一种基于随机抽样的简单算法,针对逻辑回归问题,确保对模型的预测概率和整体差异都能得到高质量的近似。研究分析了当采用杠杆得分对观测数据进行抽样时,逻辑回归的预测概率的属性,并证明可以通过样本规模远小于总观测数据量来实现准确的近似。通过全面的实证评估验证了我们的理论发现,研究为在大规模数据集上高效近似逻辑回归的预测概率提供了实用和计算高效的解决方案。