基于最小尺寸约束的聚类间准则优化

Jan, 2024

基于最小尺寸约束的聚类间准则优化

Optimization of Inter-group Criteria for Clustering with Minimum Size Constraints

Eduardo S. Laber, Lucas Murtinho

TL;DR我们提出了能够最大化两个自然的距离度量准则（最小间距和最小生成树间距）的算法，并且对无限制情况和有约束情况均给出了结果。我们的方法在实际应用中表现非常好，并通过 10 个真实数据集的经验研究提供了证据。

Abstract

Internal measures that are used to assess the quality of a clustering usually take into account intra-group and/or inter-group criteria. There are many papers in the literature that propose algorithms with provab

clustering intra-group criteria inter-group criteria minimum spacing minimum spanning tree spacing

发现论文，激发创造

公平性、半监督学习以及更多：一般的随机成对约束聚类框架

提出了一种新颖的随机成对约束方法，用于多个关键聚类目标函数，可用于建模应用程序的收缩和分析，如聚类中的公平性和半监督学习中的 Must-link 约束，并提供了近似算法的具有可证明保证的通用框架。

Mar, 2021

无需一对一约束松弛的约束聚类和多核学习

本文提出了一种新的受限聚类算法，该算法可以在考虑已有对比信息的情况下最大程度地满足约束条件，而不会将已知的链接信息转化为距离信息，以此来高效地学习核与度量，并在各种公共数据集上的表现明显优于现有方法。同时，本文还探讨了该方法如何应用于大数据处理，可以有效提高可扩展性。

Mar, 2022

定数个簇的相关聚类

研究聚类分析中的一种新方法 —— 相关聚类或定性信息聚类，探讨了最大化协议的问题和最小化分歧的问题，重点研究了聚类数为常数 k 的情况，发现该问题具有多项式时间近似解，为解决最小化分歧问题做了大量的技术工作。

Apr, 2005

通过图粗化和最优割方法的受限层次聚类

通过在短句设置中提取和总结相关信息，我们研究了以层次化方式对单词进行聚类的问题，特别是关注具有水平和垂直结构约束的聚类问题，我们通过将问题分为两个步骤来克服现有技术的瓶颈，首先，将其作为一个有软约束的正则化最小二乘问题来引导顺序图粗化算法的结果朝向水平可行解集，然后通过计算基于可用约束的最优截断高度从生成的层次树中提取平坦的聚类，我们展示了这种方法相对于现有算法具有很好的比较性能且计算上轻量级。

Dec, 2023

中央生成树问题

基于欧几里得空间中的数据，本研究提出了一个新的优化问题 ——“（分支）中心生成树”，它包含了之前提到的所有定义作为特例，并从理论和实践两个方面证明了（分支）中心生成树相对于数据中的噪声更具鲁棒性，并更适合以其骨架来总结数据集。此外，本研究还提出了一种应对 NP 难优化问题的启发式方法，并在生物学的单细胞 RNA 表达数据和植物的 3D 点云数据上进行了展示。

Apr, 2024

具有结构约束的分层聚类

本文研究了带有结构约束条件的层次聚类问题，提出了两种基于优化视角的自顶向下算法，并且通过公式化约束性正则化的方法在存在冲突先验信息的情况下得出了良好的解，同时探讨了基于差异性信息变化的目标函数的变形并进一步优化了当前技术，最后将该方法应用于实际数据集的分类学应用

May, 2018

通过最优输运实现任意尺寸约束的图割

通过提出一种基于正则化 Gromov-Wasserstein 问题的加速近端梯度下降算法，我们解决了图切割问题，并实现了稀疏解，相较于经典谱聚类算法，额外的复杂度仅为 O (log (n))，但效率更高。

Feb, 2024

最小范数和有序优化问题的近似算法

本文研究最小范数优化问题，通过引入常用的单调对称范数，相较于已有的算法，针对负载均衡和聚类等实际问题，提出了一套通用且高效的解决方案，并在此基础上给出了一些近似算法。

Nov, 2018

度量约束优化的并行投影方法

本文介绍了一种并行投影方法，用于解决度量约束优化问题，可以提高收敛速度并实现更大规模的应用。

Jan, 2019

利用两种背景知识的半监督聚类：融合成对约束和单调性约束

本研究提出了一种新方法来解决在存在成对约束和单调性约束时执行聚类的问题，通过定义一种特定的距离测量方法并设计目标函数实现了这一目的，并使用 EM 优化算法进行优化，该方法在多个基准数据集和一个现实世界的案例中进行了测试。

Feb, 2023