- 一种高效的模型评估框架: 分层、抽样和估计
模型性能评估是机器学习和计算机视觉中的关键而昂贵的任务。在本文中,我们提出了一种模型评估的统计框架,包括分层、抽样和估计组成部分。我们的实验表明,通过基于准确的模型性能预测进行 k-means 聚类的分层方法能够提供比传统的简单随机抽样更为 - K-Means 算法并行化及应用于大数据聚类
K-Means 聚类使用 LLoyd 算法是一种迭代方法,将给定数据集分成 K 个不同的簇;本文将比较并分析两种不同的方法,一种是基于 OpenMP 的平坦同步方法,另一种是基于 GPU 的并行化方法,通过比较结果测量性能改进。
- RE-RFME 模型:房地产客户细分的 RFME 模型
我们提出了一种名为 RE-RFME 的端到端管线用于将客户细分为高价值、有潜力、需关注和需激活的四个群体。具体地,我们提出了一种新颖的 RFME(最近性、频率、货币和参与度)模型来跟踪客户的行为特征并将其细分为不同的类别。最后,我们使用 K - 使用机器学习方法的隐私政策文件摘录文本自动化总结
本研究使用两种不同的聚类算法(K 均值聚类和预定义质心聚类)展示了两个隐私政策摘要模型。在评估了十种常用聚类算法后,选择了 K 均值作为第一个模型的聚类算法。基于预定义质心聚类算法的摘要模型通过欧氏距离将每个句子与预定义簇中心进行分离来摘要 - 聚类大数据的收敛时间与准确度权衡
研究在大型数据集上 k-means 和 k-median 聚类的理论和实际运行限制,通过快速压缩数据并在压缩表示上进行聚类,提供了有效聚类的理论和实践蓝图。
- 银行领域的主题建模方法比较
该研究使用了 KernelPCA 和 K-means Clustering 结合 BERTopic 架构,比较了主题建模方法,并在尼日利亚银行客户的推文数据集上展示了一致性得分为 0.8463 的连贯主题。
- 基于轮廓 Coreset 和变分量子本征求解的聚类
我们提出使用变分量子本征求解器 (VQE) 和定制的 Contour 核心集方法来解决 k-means 聚类问题,与现有的 QAOA + 核心集 k-means 聚类方法相比,我们的 VQE + Contour 核心集方法在高准确性和较低标 - 一种基于混合 SOM 和 K-means 模型的时间序列能耗聚类
介绍了一种将自组织映射和 K 均值聚类相结合的新方法来有效聚类月度能源消耗模式,通过该方法可以增强难以找到模式的数据集的聚类结果的准确性和可解释性。实验证明了该方法在聚类任务中的有效性。
- 基于图像复杂性的 fMRI-BOLD 视觉网络分类方法:在视觉数据集上使用拓扑描述符和深度混合学习
该研究提出了一种新的方法,研究使用与 COCO、ImageNet 和 SUN 等视觉数据集对应的 fMRI BOLD 时间序列构建的视觉网络的拓扑特征差异。通过计算每个视觉网络代表 COCO、ImageNet 和 SUN 的 0 维和 1 - 联邦 K-means 聚类
分散数据集的联邦学习技术可以进行机器学习,而无需数据集合,因此更好地保护数据的隐私和所有权。本研究介绍了一种以联邦方式实现 K-means 聚类的算法,旨在解决中心之间聚类数量变化和在不易分离的数据集上的收敛问题。
- 深度 NLP 模型中潜在概念的拓展发现
该研究比较了三种聚类算法:凝聚层次聚类、领导算法和 K-Means 聚类,发现 K-Means 具有潜力在单词和短语层面上对编码概念进行大规模发现。
- 利用聚类方法改善新西兰儿童福利系统的预测风险建模
通过整合主成分分析和 K 均值聚类,本文初步发现了在目前风险建模框架中对特定特征进行辨识以及这些特征对其潜在影响的研究成果,并评估了按簇训练预测模型的性能。研究结果表明可能需要为特定年龄段的儿童开发单独的模型,以提高模型准确性。然而,还需要 - 数字图像处理技术在损伤面积测量和分析中的综合应用
本文利用图像处理技术,采取直方图比较和 K 均值聚类等方法来探索柑橘叶斑病的检测,该方法可通过生成基于叶片样式的直方图来识别柑橘叶斑病,高效地为农业领域的专家提供治疗方案。
- 代理市场订单的对比学习表示
利用 Euronext 提供的 CAC40 数据集,本文构建了一个无监督学习模型,通过三元组损失函数,有效地学习了代理市场订单的表示。通过获得此学习表示,我们能够在代理订单的学习表示向量上使用 K 均值聚类算法来识别每个聚类中的不同行为类型 - 利用深度卷积自编码器进行电力系统干扰的无监督聚类
该论文提出了一种使用自编码器和 K 均值聚类的无监督学习技术,可将电力质量事件分类为下降、中断、瞬变、正常和谐波畸变等类别,并使用 t 分布随机邻域嵌入(t-SNE)可视化工具分析这些聚类,便于快速研究大量事件,为电力系统工程师诊断和纠正根 - 使用 PCA 和 K-Means 聚类非洲发型数据集
本文提出通过 K-means 聚类将非洲女性照片进行分类的方法,使用 Haarcascade 进行特征训练,使用 K-means 聚类进行图像分类。
- NFT 市场中的异常交易检测
本研究旨在揭示诸如流通交易等常见的欺诈行为,以帮助监管者缩小市场中坏演员的搜索范围并为投资者提供保护。使用市场数据,我们设计了从网络、货币和时间角度出发的定量特征,将其提供给 K-means 聚类无监督学习算法,并讨论了聚类结果的重要性和监 - ACL针对聚类感知的无监督句子表示负采样
本文提出了 ClusterNS 这一新的对比学习方法,将聚类信息引入负样本选择,同时使用改进的 K 均值聚类算法提供难负样本和识别批内的假负样本,以解决这一问题。实验表明我们的方法在无监督句子表示学习方面的性能优于基线模型,在语义文本相似度 - 振动数据集的统计特征的聚类算法比较
本研究比较了 K-means 聚类、OPTICS 和高斯混合模型聚类 (GMM),研究从振动数据集的时域和频域中提取的统计特征以及特征组合和主成分分析在聚类算法性能上的影响,并发现平均值和方差特征表现显著优于基于形状的特征,K-means - 超分辨率网络后量化的分布灵活子集量化
该论文介绍了一种名为 DFSQ 的后训练量化方法,以优化超分辨率网络,通过对激活进行通道归一化并应用分布灵活的子集量化(SQ)策略来缩短量化点的选择时间,并提出了一种快速的 K-means 聚类量化点选择策略。DFSQ 在保留各种超分辨率模