- 超越 ImageNet-1K 的深度聚类方法的扩展
在大规模基准数据集上,探索了基于特征的深度聚类方法的性能表现,并分析了数据相关因素对其影响,包括类别不平衡、类别粒度、易于识别的类别和捕获多类别的能力。通过基于 ImageNet21K 的多个新基准评估实验,发现基于特征的 $k$-mean - 改进的异常值鲁棒的 k 均值种子
对 $k$-means 算法进行改进,使其对异常值更加鲁棒,同时具备 $O (1)$ 的近似保证,且可在线性时间内输出精确的 $k$ 个聚类中心。
- 一种基于注意力机制的医学影像生成模型
提出了一种基于注意力机制的双对比度生成模型 ADC-cycleGAN,其中加入了双对比度损失项和 $K$ 均值算法,用于多层次医学图像的合成,实验结果表明该模型具有较高的 PSNR 和 SSIM 值。
- 通用弱核心集
该文提出了一种叫做 “通用弱核心集” 的概念,用于约束聚类设置中,与最近的约束设置下核心集构建结合使用,能够给出更大的数据压缩、概念上更简单,适用于广泛的约束 $k$- 中位数和 $k$- 均值问题。
- 带有一般范数目标的聚类参数化近似算法
本文提出了一种简洁的 EPAS 算法,它能够适用于多种簇集聚类问题,并且包括多种测度空间,算法的关键是新概念限制了标准封闭维数的标准,从而为聚类问题提供了更多可能性。
- ICML易实例的不同 ially-Private 聚类
本文研究的是隐私保护聚类算法,提出了一个依据难易程度来组合本来不带保护性质的聚类算法和隐私保护结果的框架,并在高斯混合数据和 $k$-means 算法中实现了样本复杂度较小的聚类效果进行了实证评估。
- 面向鲁棒聚类的统一框架的均匀集中界限
提出了基于中心的聚类算法的鲁棒框架 Median-of-Means,其在形式上覆盖了多种常见的聚类变体,其强一致性和误差率的阈值能够超过文献中已知的最佳结果,同时实验证明其在真实和合成数据集上具有很好的表现,同时还得到了一致的集中度界限。
- 集中式和本地式模型的聚类算法
该研究提出了关于最小囊括圆问题的差分隐私算法,达到了在中心模型和本地模型下不错的精度,并演示了如何在这两个模型中使用该算法来近似 $k$-means。
- 凸聚类的统计特性
本文研究了凸聚类的统计特性,将其与单链式聚类和 $k$- 均值聚类密切相关,建立了凸聚类的调参范围、提供了自由度的无偏估计和预测误差的有限样本界限,并在模拟研究中与某些传统聚类方法进行了比较。
- 设施选址问题中局部搜索算法的简化分析
本文研究了度量实例的本地搜索算法,针对设备位置问题:无容量设备位置问题(UFL),以及 $k$-median,$k$-center 和 $k$-means 的无容量版本。