Jul, 2018

将大数据转化为小数据:k 均值、主成分分析和投影聚类的常量大小核心集

TL;DR本研究提出一种称为 coresets 的降维方法,可用于在高维欧几里得空间中降低大量数据点的大小,适用于多种数据分析技术,包括 k-means 聚类、主成分分析和子空间聚类,并允许流式处理或分布式算法,其大小与输入点的数量和维度无关。