Jun, 2018

查询K均值聚类和双Dixie杯问题

TL;DR本研究提出了基于同类簇查询与有噪音答案的方法,解决了离群点存在情况下的近似K-means聚类优化问题,证明了在一定条件下可以以大概率获得最优潜在解的(1+ε)近似解,并且比目前已知的方法减少了同类簇查询数量。这种方法也推广到了控制噪音、离群点的场景中,同时在人造数据集和真实数据集上进行了测试。