增量聚类:额外聚类的情况
本文提出了一种动态聚类方法 DynamicC,它使用基于机器学习的模型,通过观察基于批处理算法的聚类决策来训练模型,在高速动态场景下进行快速准确的聚类决策。在四个真实世界数据集和一个人工合成数据集上的实验证明,DynamicC 方法相比基线批处理算法有更好的性能,同时达到了类似的准确聚类结果。
Mar, 2022
本研究旨在提出一种能够处理起始数据集非常小、能够根据不断变化的数据自适应调整的分类框架,以此为基础,提出了增量协方差导向一类支持向量机,通过控制新数据点引起的支持向量变化,取得了在人工和真实数据集上的显著分类表现。
Oct, 2016
本研究提出一种具有微聚类特性的新模型,可应用于需要聚类大小与数据集大小呈次线性增长的任务,通过比对实验数据和模拟数据的适配情况,验证该模型的有效性。
Dec, 2015
该研究采用信息理论的视角来重新构造聚类问题,避免了许多现有聚类方法所依赖的非常规结构的假设,且捕捉了非线性关系。基于集体相似度而非传统的成对度量,该方法在不同领域内都表现出比现有算法更高的聚类一致性。
Nov, 2005
本文研究了基于稳定性假设的交互式聚类算法设计,算法开始于任意初始聚类,只进行每步的局部更改;我们证明在这种约束条件下,仍然可以设计出具有可证明高效和准确聚类能力的算法,并在真实数据上进行了实证。
Dec, 2013
本文提出了一种三阶段方法,通过半监督的深度聚类模型和异常检测,结合聚类关键字提取方法,对金融领域中现有事件数据集中原有和未知事件类型的分类和聚类,从而通过增量方式发现新的事件类型,并在真实数据集中取得了显著成效。
Feb, 2023
本文介绍了一种基于 BIRCH 聚类算法的传输案例选择机制,通过对聚类算法的调查,可以得出这种选择机制可以在不考虑顺序、大小和数据集的维数的前提下,提高传输结果的适用性,并在一个离散制造场景的工业时间序列数据集上进行了评估。
Apr, 2022
通过使用 Elkan(2003)的距离界限方法来加速 Sculley(2010)的 Mini-Batch K-Means 算法,提出了一种新算法。使用嵌套的 Mini-Batches 提出了两个困难。实验表明,得到的嵌套 Mini-Batch 算法非常有效,通常比标准 Mini-Batch 算法早 100 次到达经验最小值的 1%。
Feb, 2016
基于子集集合的归一化特征值谱,我们提出了一种增量谱聚类方法,将数据分成可管理的子集,对每个子集进行聚类,根据特征值谱的相似性合并不同子集的聚类结果,从而实现整个数据集的聚类。实验结果表明,该方法能够获得接近整个数据集聚类结果的子集聚类和合并。
Aug, 2023