集成特征选择器稳定性的快速估算方法
本文介绍了一种新的数据流集成分类器,Geometrically Optimum and Online-Weighted Ensemble (GOOWE)。GOOWE通过使用包含最近数据实例的滑动窗口,为组成分类器分配最优权重。作者在真实世界数据集和MOA库的合成数据生成器中使用GOOWE,通过两个情景分析了该权重系统对预测准确性的影响,并将其与8种其他集成分类器进行了比较。实验结果表明,与基线相比,GOOWE在不同类型的概念漂移下提供了更好的反应,并且具有保守的时间和内存要求。
Sep, 2017
提出了一种称为 QWYC(即 Quit When You Can)的贪心算法,用于设计分类器模型组合的评估顺序与提前终止阈值,实现了在保持高精度的同时显著减少平均评估时间。在基准和真实世界的问题上进行了实验证明,该算法相对于早期工作可以使平均评估时间加速约 2 倍-4 倍,且针对性能更好 。
Jun, 2018
本文提出了一个新颖的基于元学习的动态集成选择框架,用于提高过低训练数据量问题下的分类精度,通过五个不同类型的元特征来衡量分类器为输入样本分类的能力,并用这些元特征来训练元分类器,从而选择最有能力的分类器进行集成。
Sep, 2018
通过引入选择性集合来减轻模型的不一致性,使用随机选定的起始条件训练一组模型的预测上执行假设检验;在这些情况下,选择性集合可以放弃不一致预测结果并在指定的置信水平下达成一致结果,多个基准数据集上展示出零一致性预测点和低至1.5%的放弃率。
Nov, 2021
介绍了一种称为S-Lipschitz分类器的新方法,用于分析集成模型的理论鲁棒性,并给出了集成模型比任何单个分类器更稳健的条件和更不稳健的条件。
Apr, 2023
研究加入集成(ensembling)技术在分类任务中的性能提升问题,证明当集成模型中错误率低于集成模型间的不同率时,在学习任务中加入集成技术可以显著提高性能。通过理论和实验的方式证明这种推论,并在实践中找出集成技术适用和不适用的情况。
May, 2023
通过线性独立性分析研究集成大小和分类准确度之间的关系,提出了基于该关系的集成大小的方法。实证结果表明增加分类器数量提高准确度,但存在收益递减点。该研究为进一步研究集成设计的复杂动态提供了开拓途径,并为实际场景中构建高效有效的集成提供了指导。
Aug, 2023
动态集成选择(DES)是一种多分类器系统(MCS)的方法,在选择阶段为每个查询样本选择一个集成。实验结果表明,使用准确度作为选择集成的度量指标,PS-DES优于单独的DES技术。
Sep, 2023
我们提出了一个新的算法稳定性框架,用于多类分类。该框架使用连续分数,并引入了稳定得分生成和标签选择机制,以解决分类算法中的不稳定性问题。实验证明,该方法在保持准确性的同时,提供了对不稳定分类器的必要保护。
May, 2024
本研究针对自动机器学习(AutoML)中后期集成导致的推理时间较长的问题,提出了一种硬件感知的集成选择方法。该方法综合考虑了预测准确性和硬件效率,通过实验证明了在维持竞争性准确度的同时,显著提升了集成模型的操作效率,为更加资源高效的AutoML系统奠定了基础。
Aug, 2024