- 基于合理粒度原则的聚类生成引领粒团
本研究介绍了一种利用可证明粒度原理为质量评估的数据聚类方法,并采用二叉树修剪策略和异常检测方法确定每个 GB 的最佳子 GB 组合和识别异常 GB,从而最大化生成的 GB 质量并提高聚类准确性和归一化互信息。
- 模糊均值偏移的收敛性分析
该研究分析了模糊均值漂移(BMS)算法作为优化过程的收敛性质,并提供了即使数据点序列收敛到多个点,产生多个聚类的收敛保证,同时还利用了收敛点的几何特征来展示 BMS 算法的快速收敛。
- 使用聚类进行语言模型训练的平衡数据采样
在这篇论文中,我们提出了一种名为 ClusterClip Sampling 的数据采样策略,利用数据聚类来平衡训练数据的文本分布以获得更好的模型训练效果。通过基于聚类结果对训练过程中的常见样本和罕见样本进行平衡,以及引入重复剪裁操作来减轻由 - 聚类的递归方案
我们的研究论文提出了一种递归方案来对地理(气候学)实验中获取的数据进行聚类,通过与专家评估结果的比较,表明使用这种新方法的聚类结果更可接受。
- 一种高级加密货币价值预测的自适应网络方法
本文研究了使用自适应网络模糊推理系统 (ANFIS) 预测未来七天加密货币价格的架构。使用每日时间框架的比特币 (BTC)、以太坊 (ETH)、比特币占主导地位 (BTC.D) 和以太坊占主导地位 (ETH.D) 的历史数据进行预测,采用混 - 网络感知嵌入的无监督学习
通过估计数值节点属性之间的网络距离,我们可以创建网络感知嵌入,而不是对网络的节点进行聚类。在本文中,我们修复了无监督学习文献中的这个盲点,并展示了我们的方法在各种领域的应用中始终是有益的,并且可以提供可操作的见解。
- 基于特征值的增量谱聚类
基于子集集合的归一化特征值谱,我们提出了一种增量谱聚类方法,将数据分成可管理的子集,对每个子集进行聚类,根据特征值谱的相似性合并不同子集的聚类结果,从而实现整个数据集的聚类。实验结果表明,该方法能够获得接近整个数据集聚类结果的子集聚类和合并 - 数据聚类的鲁棒异常张量低秩表示
提出了一种用于同时检测异常值和对被异常值污染的张量数据进行聚类的鲁棒低秩表示方法,基于张量奇异值分解代数框架。实验证明了该算法的有效性。
- 树形变分自编码器
提出了一种新的生成分层聚类模型 ——Tree Variational Autoencoder(TreeVAE),它能够分层地划分样本并发现数据中潜在结构,并利用树形结构中的叶子节点解码器提高了生成性能。TreeVAE 在不同的数据集上表现出 - 群体智能在数据聚类机制中的作用
本文回顾了最新的数据聚类方法,包括传统算法 K-means 的局限性以及 Swarm-based 算法如何解决大数据集聚类的问题,并比较它们哪个适合特定的实际问题。
- 一种基于松鼠猴算法和广义正态分布算法的对抗学习策略的混合算法,用于解决数据聚类问题
研究了数据聚类的优化方法,提出了基于黑猩猩优化算法、广义正态分布算法和对抗学习策略的 ChOAGNDA 方法,用于解决大型和复杂的数据聚类问题。优化结果表明该方法在最小化簇内距离总和、降低错误率和加速收敛速度等方面显著优于其他现有方法。
- 量子变分和量子启发式聚类
本研究提出了一种基于变分量子电路的量子算法,用于对数据进行聚类;该算法可以将数据分类为多个聚类,并且可以在少量量子比特的嘈杂中间量子计算设备上轻松实现。
- 恶意广告 URL 检测框架的对抗性攻击分析
本文讨论了利用机器学习方法检测恶意广告链接的问题,提出了一种使用多种特征并结合不同机器学习算法的检测系统,并实现了一种基于 K-means 算法的数据聚类方法以及对决策树模型的攻击形式。
- ICLR学习弱监督对比表示
本文提出了一种二阶段的弱监督对比学习方法,第一阶段根据辅助信息对数据进行聚类,第二阶段在同一簇中学习相似的表征和不同簇的数据的不相似的表征。通过实验表明,与传统的自监督表示相比,辅助信息注入表示使性能更接近于监督表示。同时,本方法在与其他基 - 字符串的模糊分割
本文讨论了数据聚类问题中的一种情况,提出了使用前缀结构跟踪文本片段到模糊属性的映射过程来解决模糊模式匹配问题的启发式算法。另外,还考虑了模糊模式下最佳分割整个文本的问题,并使用动态规划方法得到解决。
- 基于嵌入式推荐系统的大规模工作与候选人匹配
本文研究基于嵌入的推荐系统应用于大规模的招聘场景,提出融合不同级别的文本、语义实体和位置信息的嵌入式聚类方法构建 Faiss 索引来支持候选人检索,最终运用二阶段模型完成了在线招聘匹配系统,并取得了显著的成功。
- 更好的面向个体公平的 $k$- 聚类算法
运用线性规划和局部搜索算法解决在数据聚类问题中,$\ell_p$-range 目标下的个体公平问题。通过修改 LP 理论和结合局部搜索算法实践,实现更优算法,并在实验中展现了出众的表现。
- 通过对比聚类分配实现视觉特征的无监督学习
本文介绍了一种在线聚类算法 SwAV,在不需要计算成对对比的基础上,通过使用一种被称为预测机制的方式来建立视图之间的一致性,并提出了一种新的数据增强策略多裁剪,在 ImageNet 数据集上达到 75.3%的 top-1 准确率,并超出了所 - MM带储存费用的半离散最优输运的牛顿算法
本文介绍和证明了一种阻尼牛顿算法的收敛性,以近似解决存储费用、硬容量约束下的半离散最优输运问题,并探讨了其在队列罚函数问题、数据聚类等方面的应用,是第一种基于数值方法并具有收敛性的解决该变体问题的算法,同时不需要任何关于源测度支集的连通性假 - 从嘈杂数据中学习鲁棒性图形
该论文提出了一种新颖的鲁棒图学习方案,能够通过自适应地消除原始数据中的噪声和错误来从真实世界的嘈杂数据中学习可靠的图,在数据聚类、半监督分类和数据恢复方面具有显著的性能提升,并在图像 / 文档聚类,目标识别,图像遮挡去除和视频背景减除等领域