增量聚类：额外聚类的情况

Jun, 2014

Incremental Clustering: The Case for Extra Clusters

Margareta Ackerman, Sanjoy Dasgupta

TL;DR本文研究了增量聚类方法的优缺点，发现增量聚类方法相对于批处理模型存在明显的劣势，即无法识别一类基本的聚类结构，但是可以通过增加聚类实现对增量聚类方法的限制的克服。

Abstract

The explosion in the amount of data available for analysis often necessitates a transition from batch to incremental clustering methods, which process one element at a time and typically store only a small subset of the data. In this paper, we initiate the formal analysis of

incremental clustering methods batch model cluster structure data analysis limitations

发现论文，激发创造

高效动态聚类：从历史聚类演变中捕获模式

本文提出了一种动态聚类方法 DynamicC，它使用基于机器学习的模型，通过观察基于批处理算法的聚类决策来训练模型，在高速动态场景下进行快速准确的聚类决策。在四个真实世界数据集和一个人工合成数据集上的实验证明，DynamicC 方法相比基线批处理算法有更好的性能，同时达到了类似的准确聚类结果。

Mar, 2022

增量层次文本聚类方法：综述

这篇论文旨在分析 2010 年至 2018 年期间发表的各种层次和增量聚类技术，以进一步组织和比较文本聚类的相关研究，从而提供对该领域研究的更好理解。

Dec, 2023

数据分类的增量一类模型

本研究旨在提出一种能够处理起始数据集非常小、能够根据不断变化的数据自适应调整的分类框架，以此为基础，提出了增量协方差导向一类支持向量机，通过控制新数据点引起的支持向量变化，取得了在人工和真实数据集上的显著分类表现。

Oct, 2016

微聚类：当聚类大小与数据集大小呈次线性增长时

本研究提出一种具有微聚类特性的新模型，可应用于需要聚类大小与数据集大小呈次线性增长的任务，通过比对实验数据和模拟数据的适配情况，验证该模型的有效性。

Dec, 2015

基于信息的聚类

该研究采用信息理论的视角来重新构造聚类问题，避免了许多现有聚类方法所依赖的非常规结构的假设，且捕捉了非线性关系。基于集体相似度而非传统的成对度量，该方法在不同领域内都表现出比现有算法更高的聚类一致性。

Nov, 2005

交互式聚类的本地算法

本文研究了基于稳定性假设的交互式聚类算法设计，算法开始于任意初始聚类，只进行每步的局部更改；我们证明在这种约束条件下，仍然可以设计出具有可证明高效和准确聚类能力的算法，并在真实数据上进行了实证。

Dec, 2013

基于异常检测的金融事件类型增量发现方法

本文提出了一种三阶段方法，通过半监督的深度聚类模型和异常检测，结合聚类关键字提取方法，对金融领域中现有事件数据集中原有和未知事件类型的分类和聚类，从而通过增量方式发现新的事件类型，并在真实数据集中取得了显著成效。

Feb, 2023

面向深度工业迁移学习的聚类算法：迁移案例选择

本文介绍了一种基于 BIRCH 聚类算法的传输案例选择机制，通过对聚类算法的调查，可以得出这种选择机制可以在不考虑顺序、大小和数据集的维数的前提下，提高传输结果的适用性，并在一个离散制造场景的工业时间序列数据集上进行了评估。

Apr, 2022

嵌套小批量 K-Means

通过使用 Elkan（2003）的距离界限方法来加速 Sculley（2010）的 Mini-Batch K-Means 算法，提出了一种新算法。使用嵌套的 Mini-Batches 提出了两个困难。实验表明，得到的嵌套 Mini-Batch 算法非常有效，通常比标准 Mini-Batch 算法早 100 次到达经验最小值的 1%。

Feb, 2016

基于特征值的增量谱聚类

基于子集集合的归一化特征值谱，我们提出了一种增量谱聚类方法，将数据分成可管理的子集，对每个子集进行聚类，根据特征值谱的相似性合并不同子集的聚类结果，从而实现整个数据集的聚类。实验结果表明，该方法能够获得接近整个数据集聚类结果的子集聚类和合并。

Aug, 2023