- 基于大型语言模型的短文本人可解释聚类
大语言模型在内容生成能力方面取得了巨大的增长,本研究展示了这些模型还可以成功地对人类生成的内容进行聚类,通过独特性和可解释性两个度量标准来定义成功。该研究验证了这一成功,通过人工审阅和 ChatGPT 的比较,提供了一种自动化的方法来弥合挑 - 基于聚类的多任务深度神经网络用于太阳能光伏发电预测
本文提出了一种基于聚类的多任务深度神经网络(CM-DNN)框架,用于预测光伏发电量。通过应用 K-means 算法将数据聚类为不同的客户类型,并为每个类型采用深度神经网络进行训练,然后进行模型知识传输以提高目标任务的训练准确性。通过对真实世 - 通过时间和特征关注解释生态瞬时评估数据的聚类
本文通过提出基于注意力机制的可解释性框架来识别在区分集群时起主要作用的重要时间点和变量,并分析了应用于 187 个个体分为 3 个集群的 EMA 数据集的注意力重要属性,从集群、特征和个体水平提供了不同的特征。
- 基于钻井数据的岩体无监督机器学习分类:数据驱动系统如何处理现有岩体分类系统的局限性?
基于钻探数据开发的数据驱动系统在岩体分类中能够形成明确的岩体簇群,为未来的分类系统提供了潜力。
- 大规模稀疏网络中的社群筛选
在研究中,我们介绍了一种适用于大规模稀疏网络的直观客观函数来量化聚类结果的质量,并且通过模拟网络的优化试验和基准问题的应用来证明了这种方法的实用性和准确性。
- 用于可解释无监督树集合的特征图:中心性、交互性及在疾病亚型划分中的应用
在医疗保健等高风险领域中,可以理解模型预测原理同实现高预测准确性一样重要的可解释机器学习已成为利用人工智能的核心。本研究引入了从非监督随机森林构建特征图的新方法和通过这些图派生有效特征组合的特征选择策略,通过在整个数据集和个别聚类上构造特征 - Grad Queue: 强化稀疏梯度的概率框架
使用在线梯度队列和聚类的机制来增强数据批次中的稀疏成分,提高大型批次更新中信息梯度的效果。通过测量梯度稀缺程度和聚类方法,该机制在最小化冲突成分的同时,增加了批次边界的优化,从而更好地接近最小值。该方法在 CIFAR10、MNIST 和 R - 多层关联聚类
我们在这篇论文中建立了多层相关聚类,这是对相关聚类(Bansal 等人,FOCS'02)在多层设置中的一种新的概括。我们首先设计了一个基于知名区域生长技术的 O (Llogn) 逼近算法(其中 L 是层数),然后研究了带有概率约束的一个重要 - 变分深度生存机器:带有被截断结果的生存回归
通过更好地聚类生存数据和组合原始分布,本文提出了两种变体的变分自编码器(VAE),离散和连续,来生成聚类输入协变量的潜在变量。我们的模型通过同时优化 VAE 损失和回归损失进行端到端训练,实验证明了我们的方法在聚类结果和长期预测上具有竞争力 - 跨时间频谱自编码器(CTSAE):用于聚类引力波故障的无监督降维
利用 Cross-Temporal Spectrogram Autoencoder (CTSAE) 这一无监督方法进行 LIGO 数据的降维和聚类,相较于半监督学习方法,在主通道上训练和评估的 CTSAE 模型在聚类任务中展现出卓越的性能, - 离群点下的稀疏 Wasserstein 质心的近似算法
在存在异常值的情况下,本文研究了异常值稀疏 Wasserstein Barycenter 问题,并提出了基于聚类的 LP 方法和 coreset 技术,实现了高精度逼近和高效率。
- 比较聚类方法使用相对有效性指数的研究
这项研究通过对超过 270 万个聚类分区进行实验,发现 RVIs 在非传统任务上并不适用,对此类应用得出的结论可能是误导性的,因此建议使用外部验证和相关领域知识来选择正规化程序、表示方法和距离度量。
- 超越已知聚类:为高效泛化类别发现探索新原型
基于知识学习的通用类发现 (GCD) 旨在根据来自已标记和未标记数据的知识动态地为未标记数据分配标签,然而现有方法主要依赖于聚类算法的性能,并受限于聚类算法的固有局限性。
- 增强的高光谱图像子空间聚类的展开式 ADMM
本文介绍了一种创新的基于深度展开的聚类架构,通过对稀疏子空间聚类的交替方向方法求解器进行展开,可以捕捉到高光谱图像数据的结构特征,并采用 K 最近邻算法保持结构的模块,实验证明基于展开方法在高光谱图像聚类中具有潜力,并比现有技术表现出更好的 - 无监督可见 - 红外再识别:基于伪标签修正和模态层面对齐
无监督可见红外人员重新识别 (UVI-ReID) 是研究的重点,文章提出了一种新的无监督跨模态人员重新识别框架 (PRAISE),通过修正伪标签和模态层对齐策略来提高性能,并在两个基准数据集上取得了最新的成果。
- scCDCG: 基于深度剪切信息图嵌入的单细胞 RNA 序列的高效深度结构聚类
通过引入 scCDCG(基于深度剪切信息图的单细胞 RNA 测序聚类)框架,我们解决了传统聚类方法在 scRNA-seq 数据分析中忽略基因表达特征中嵌入的结构信息所带来的问题,提出了一种有效且准确的聚类方法,能够同时利用细胞间的高阶结构信 - 基于聚类的视频摘要与时序上下文感知
提出了 TAC-SUM,一种新颖且高效的无需训练的视频摘要方法,它通过融入时间上下文来解决现有基于聚类模型的局限性。该方法将输入视频分割为具有聚类信息的时间连续片段,使时间感知得以注入到聚类过程中,以突出先前的基于聚类的摘要方法。最终,利用 - 电子商务的一种新型基于行为的推荐系统
本研究提出了一种基于用户行为的推荐系统,通过聚类活跃用户、确定邻域、收集相似用户、基于相似用户计算产品声誉以及推荐高声誉产品等方法,结合产品类别的无监督聚类方法,提供精确的个性化推荐,改善了电子商务推荐系统的性能和准确性。实验结果显示,该方 - 走向可解释聚类:基于约束声明的方法
我们提出了一种基于解释驱动的集群选择的解释可调的约束聚类方法,该方法能够生成高质量的且可解释的聚类,其中聚类结果考虑了特征的覆盖率和区分度,并能够整合领域专家知识和用户约束。
- CVPR基于神经聚类的视觉表示学习
我们通过重新审视聚类,一种机器学习和数据分析中最经典的方法之一,来研究机器视觉的一个基本方面:特征的测量。我们提出了特征提取与聚类(FEC)的概念性优雅但惊人的特征提取方法,它将特征提取视为从数据中选择代表并自动捕捉底层数据分布的过程。通过