集成特征选择器稳定性的快速估算方法

Aug, 2021

集成特征选择器稳定性的快速估算方法

Fast Estimation Method for the Stability of Ensemble Feature Selectors

Rina Onda, Zhengyan Gao, Masaaki Kotera, Kenta Oono

TL;DR本文提出了一个特征选择器的模拟器，并将其应用于评估集成特征选择器的稳定性以减少计算成本。研究表明，本文所提到的方法在理论和实践上都能够降低计算成本，并提高特征选择器的稳定性。

Abstract

It is preferred that feature selectors be \textit{stable} for better interpretabity and robust prediction. Ensembling is known to be effective for improving the →

发现论文，激发创造

GOOWE: 面向动态数据流的几何最佳化和在线加权集成分类器

本文介绍了一种新的数据流集成分类器，Geometrically Optimum and Online-Weighted Ensemble (GOOWE)。GOOWE通过使用包含最近数据实例的滑动窗口，为组成分类器分配最优权重。作者在真实世界数据集和MOA库的合成数据生成器中使用GOOWE，通过两个情景分析了该权重系统对预测准确性的影响，并将其与8种其他集成分类器进行了比较。实验结果表明，与基线相比，GOOWE在不同类型的概念漂移下提供了更好的反应，并且具有保守的时间和内存要求。

Sep, 2017

可退出机制：集成排序优化的高效评估方法

提出了一种称为 QWYC（即 Quit When You Can）的贪心算法，用于设计分类器模型组合的评估顺序与提前终止阈值，实现了在保持高精度的同时显著减少平均评估时间。在基准和真实世界的问题上进行了实验证明，该算法相对于早期工作可以使平均评估时间加速约 2 倍-4 倍，且针对性能更好。

Jun, 2018

META-DES：一种使用元学习的动态集成选择框架

本文提出了一个新颖的基于元学习的动态集成选择框架，用于提高过低训练数据量问题下的分类精度，通过五个不同类型的元特征来衡量分类器为输入样本分类的能力，并用这些元特征来训练元分类器，从而选择最有能力的分类器进行集成。

Sep, 2018

一致性预测的选择性集成

通过引入选择性集合来减轻模型的不一致性，使用随机选定的起始条件训练一组模型的预测上执行假设检验；在这些情况下，选择性集合可以放弃不一致预测结果并在指定的置信水平下达成一致结果，多个基准数据集上展示出零一致性预测点和低至1.5％的放弃率。

Nov, 2021

证明集合：一般具有S-Lipschitz的证明理论

介绍了一种称为S-Lipschitz分类器的新方法，用于分析集成模型的理论鲁棒性，并给出了集成模型比任何单个分类器更稳健的条件和更不稳健的条件。

Apr, 2023

集成学习何时真正有效？

研究加入集成（ensembling）技术在分类任务中的性能提升问题，证明当集成模型中错误率低于集成模型间的不同率时，在学习任务中加入集成技术可以显著提高性能。通过理论和实验的方式证明这种推论，并在实践中找出集成技术适用和不适用的情况。

May, 2023

利用组件分类器的线性独立性：优化在线集成的大小和预测准确性

通过线性独立性分析研究集成大小和分类准确度之间的关系，提出了基于该关系的集成大小的方法。实证结果表明增加分类器数量提高准确度，但存在收益递减点。该研究为进一步研究集成设计的复杂动态提供了开拓途径，并为实际场景中构建高效有效的集成提供了指导。

Aug, 2023

改进动态集成选择方法的后选算法

动态集成选择（DES）是一种多分类器系统（MCS）的方法，在选择阶段为每个查询样本选择一个集成。实验结果表明，使用准确度作为选择集成的度量指标，PS-DES优于单独的DES技术。

Sep, 2023

利用扩展的argmax构建稳定分类器

我们提出了一个新的算法稳定性框架，用于多类分类。该框架使用连续分数，并引入了稳定得分生成和标签选择机制，以解决分类算法中的不稳定性问题。实验证明，该方法在保持准确性的同时，提供了对不稳定分类器的必要保护。

May, 2024

硬件感知的集成选择以平衡预测准确性和成本

本研究针对自动机器学习（AutoML）中后期集成导致的推理时间较长的问题，提出了一种硬件感知的集成选择方法。该方法综合考虑了预测准确性和硬件效率，通过实验证明了在维持竞争性准确度的同时，显著提升了集成模型的操作效率，为更加资源高效的AutoML系统奠定了基础。

Aug, 2024