- 基于薛定谔算子谱的图像对比度增强
本研究提出了一种基于 Schrodinger 算子二维平方特征函数的图像对比增强方法,该方法通过在图像重建过程中控制像素强度的设计参数 γ 进行投影。使用 k-means 选择 γ 值,以保留图像的空间邻近性信息,同时提出了基于非支配排序遗 - 一种解决低维 k-means 聚类问题的割平面算法
聚类是数据科学和机器学习中最基本的工具之一,k-means 聚类是最常见的方法之一。本文研究了低维数据实例的 k-means 问题,并将其表示为结构化的凸分配问题,利用低维结构解决大数据集的问题。该方法结合了全局优化理论的方法来加速处理程序 - 多样性感知聚类:计算复杂度和近似算法
在这项研究中,我们研究了多样性感知聚类问题,其中数据点与多个属性相关联,导致交叉组。聚类解决方案需要确保从每个组中选择最少数量的聚类中心,同时最小化聚类目标,可以是 $k$-median、$k$-means 或 $k$-supplier。我 - 线性时间的 Evidence Accumulation 聚类方法与 KMeans
通过实验和比较,本研究证明了集成聚类方法中的证据累积聚类和 k-means 算法在共识聚类中取得了较好的结果和较低的计算成本。
- 通过聚类神经网络输出进行自动皮肤镜模式发现的人机交互
通过自动的无监督聚类,可以从大型图像数据集中提取具有诊断相关性且可人工解释的视觉模式群集。
- HurriCast: 利用机器学习与统计建模的 自动框架进行飓风预测
本研究通过结合 ARIMA 模型和 K-MEANS 的方法,以及利用 Autoencoder 进行增强的模拟,有效地模拟了历史飓风行为并提供了潜在未来轨迹和强度的详细预测,为风险管理策略提供了可行的见解。
- 你知道什么是 q-means 吗?
改进版的 q-means 量子算法和 dequantized 算法,分别以 O ((k^2)/(ε^2)(√k*d + log (Nd))) 和 O ((k^2)/(ε^2)(kd + log (Nd))) 的时间复杂度在近似 k-mean - 从流形学习的角度重新思考 k-means
该论文提出了一种基于流形学习和张量正则化的聚类算法,不同于传统的基于 k-means 的方法,该算法通过构建距离矩阵来直接检测数据簇,同时应用于多视图数据中,证明了其优越性能。
- 群体智能在数据聚类机制中的作用
本文回顾了最新的数据聚类方法,包括传统算法 K-means 的局限性以及 Swarm-based 算法如何解决大数据集聚类的问题,并比较它们哪个适合特定的实际问题。
- 可解释聚类中深度减少的不可能性
本文研究可解释 K-means 和 K-median 聚类问题,证明了在欧几里得平面上,解释深度降低会导致聚类成本的无界损失,并将其扩展到 K-center 目标。
- EMNLPBERTopic 在多领域短文本上的泛化实验
本研究探讨了在短的多领域文本中如何运用 BERTopic 算法进行主题建模,并发现与 Latent Dirichlet Allocation 相比,BERTopic 在主题连贯性和多样性方面的表现更好。我们进一步分析了 BERTopic 所 - 将聚类视为不适定问题:K-Means 算法实验
本文研究了基于 KMeans 算法的聚类过程作为反问题的特殊情况,探索了通过主成分分析来改进聚类反问题质量的尝试,并比较了两种定量特征选择方法之间的关系。使用神经科学数据库中的功能性磁共振成像范例来验证结果。
- ICML谱聚类的更紧密分析,以及更多
本研究针对典型的谱聚类算法,探讨在一些较弱条件下其性能为何,还研究了利用少于 k 个特征向量进行嵌入的谱聚类,实验表明在合成和真实数据上,使用少于 k 个特征向量时,谱聚类也能够产生相当或更好的结果。
- 社会公平的常积分因子 $k$- 聚类近似算法
本研究对含 m 个群体的社会公平 (l_p, k)- 聚类问题的近似算法进行研究,其中特殊情况包括社会公平 k - 中心 (p=1) 和社会公平 k - 均值 (p=2) 问题。研究分别给出了多项式时间和两种不同的 (n^{2^{O (p) - 基于 Granular-Ball 的高效自适应聚类算法 GBC
提出了一种新的聚类方法,名为自适应基于颗粒 - 球分化的聚类方法,能够高效识别形状未知、复杂的聚类,同时提供了一种有效的自适应方法来描述世界,并促进了自适应、高效的 AI 技术及密度计算模型的研究和发展。
- 聚类分析中的形状复杂性
利用多维数据的形状复杂度概念,应用在特定的非线性函数上,制定了一种新的 “中等距离” 下的基于约束的非线性规划问题,从而探索更有效的聚类缩放因子数量的方法。
- 极值理论概率分布聚类
本文基于极值理论的广义帕累托分布,提出了一种新的聚类算法 GPD k-means,它模型化了聚类的距离分布,并用概率模型描述了每个类别。实验证明,在合成数据集和真实数据集上,GPD k-means 优于传统聚类算法。
- ICLR学习增强 K 均值聚类
通过引入预测器,本文提出了一种新的 $k$-means 聚类算法,可以提高聚类的质量和效率,打破了此前关于 $k$-means 问题的计算难点。
- 可解释聚类的近似最紧算法
本文研究了一个最近提出的可解释聚类框架,专注于 k-medians 和 k-means 问题,并提供了近似算法和上下界。
- 具有稳定性假设的差分隐私聚类算法
本文研究了在输入稳定性假设下的差分隐私聚类问题,提出了一种简单的算法,分析了其在 Wasserstein 距离和 k-means 代价等方面的效用,可直接应用于 “好” 的 k - 中位数实例和本地模型的差分隐私。