- DimVis:可解释的增强机构在降维中解释视觉聚类
DimVis 是一个利用监督可解释的增强机器模型的可视化工具,通过交互式探索 UMAP 投影来提供高维数据分析的特征相关性解释,在转化复杂数据集为简单视觉表示时,增加了解释性,并解决了引入人为失真和解释性问题的困扰。
- 分布式约简:用格罗莫夫 - 瓦瑟斯坦投影统一维度约简和聚类
使用优化运输工具把无监督学习、降维和聚类统一到一个框架中,解决聚类和降维的优化问题,通过实验验证了该方法在图像和基因组数据集上的卓越性能。
- 多模式协同探索组合库中的结构性质关系的多任务贝叶斯优化
我们提出并实现了一种共同编排方法,通过变分自动编码器进行降维和表示学习,结合多任务高斯过程,可以用于具有光谱或图像等复杂可观测量的测量,该方法可以扩展到多种测量模态和任意维度的测量信号。
- 加速双曲 t-SNE
本研究使用极坐标四叉树构建超几何嵌入的加速结构,相比现有方法在更短的时间内计算出类似质量的嵌入结果。
- 迭代相关矩阵分析 (IRMA) 用于类别区分子空间的鉴定
通过迭代应用广义矩阵学习向量量化(Generalized Matrix Learning Vector Quantization)进行特征相关性分析和类别区分子空间构建,我们引入并探讨了迭代相关矩阵分析(Iterated Relevance - MISS: 多类别可解释评分系统
这项研究介绍了一种新颖的机器学习方法,用于构建多类别可解释评分系统(MISS),这是一种完全数据驱动的方法,用于生成针对多类别分类问题的单一、稀疏和用户友好的评分系统。评分系统在医疗保健、刑事司法和其他需要预测可解释性和易用性的领域中普遍应 - 线性递归特征机器可证明恢复低秩矩阵
神经网络在绕过维度灾难的同时能够准确预测的基础是对特征学习的隐式维度缩减过程的理解,本文提出了递归特征机(RFM)作为一种能够显式地执行特征学习的算法,并且在稀疏线性回归等问题中展示了其维度缩减能力和优于标准算法的性能。
- 使用随机块模型推断带属性超图中的社区结构
通过将节点属性数据纳入超图中的社区结构学习,本研究提出了一种统计框架 HyperNEO,可以增强合成和实际超图中社区结构的学习效果,同时将使用随机块模型等模型获得的学习表示应用降维方法 UMAP 可以将节点映射到二维向量空间,从而在实际超图 - ANALYTiC:机器学习中决策边界和降维的理解
使用主动学习和降维技术结合决策边界,提取轨迹数据中的模式和聚类特征,以提高轨迹标记的效率和准确性。
- LeanVec:通过使向量适应进行更快的搜索
LeanVec 是一个结合了线性降维和向量量化的框架,用于加速高维度向量的相似性搜索,并在维持准确度的同时提高性能。它提供了针对分布内和分布外查询的两个变体,能够产生与最新的深度学习替代方案相当的准确度,并在搜索吞吐量上提高了 3.7 倍, - 通过测量局部方向离散度的方法实现鲁棒高效的边界点检测
提出了一种使用本地方向分散 (LoDD) 方法来检测边界点的鲁棒且高效的方法,该方法在非凸结构和高维流形中能够准确地识别边界点,并在多个数据集上展示了良好的聚类性能。
- 循环式火焰振荡器阵列的降维与动态模式识别的深度神经网络方法
在振荡燃烧系统中,本文提出了一种基于双层双向长短期记忆变分自编码器(Bi-LSTM-VAE)降维模型和基于二维 Wasserstein 距离的分类器(WDC)的方法(Bi-LSTM-VAE-WDC),以识别动力学模式。模型通过将燃烧系统的高 - 用于评估无监督表示学习的度量空间幅度
度量空间的规模最近被确定为一种新型不变量,它可以在多个尺度上衡量空间的 ' 有效大小 '。通过捕捉数据的几何和拓扑特性,度量空间可以解决无监督表示学习任务中的挑战。我们形式化了有限度量空间的度量函数之间的新概念差异度,并用它们导出了一种用于 - 应用降维作为 LSTM-CNN 模型的先导用于基于 ECoG 的脑机接口中图像和运动信号的分类
通过优化脑机接口(BCI)中的运动想象分类算法,利用无监督的降维技术 UMAP 和 KNN 评估了使用监督学习方法 LSTM 和 CNN 进行分类任务的必要性,实验结果表明 UMAP 降维后具有高 KNN 分数的参与者同样在监督深度学习模型 - 基于机器学习的胎儿健康数据分析分类方法
使用机器学习模型对胎儿健康进行分类分析,评估了不同模型的分类性能,并实施了降维技术以提高分类性能,其中 TabNet 模型在一个胎儿健康数据集上实现了 94.36% 的分类准确率。
- 有噪声数据中的非负矩阵分解算法
本文介绍了两种算法,Shift-NMF 和 Nearly-NMF,可以处理输入数据的嘈杂性和负值,并且可以正确恢复非负信号,而无需对负数据进行截断,避免了引入正偏移。
- 计算近似的 ℓp 敏感度
近期在降维回归任务中引入了敏感性的概念,提供了通过子采样移除低敏感性数据点后的近似质量的可证明保证。本文提供了计算给定矩阵的相关汇总统计量和近似敏感性的高效算法,分别针对不同的 Lp 范数进行了泛化,并通过实验表明,实际数据集的敏感性远远小 - 属性多关系图的谱聚类
提出了一种针对属性和多关系网络的联合降维技术 SpectralMix,该方法通过综合利用属性、关系类型和图结构的信息,实现对聚类结果的解释,并在实际数据集上展现了其优越性。
- 3D 地震反演的深度压缩学习
使用压缩学习框架和深度卷积神经网络(DCNN)联合优化维度缩减算子和实现三维反演编码 - 解码器的方法,以极少量的地震源进行预堆叠数据的三维地震反演,通过学习稀疏二进制感知层来实现维度缩减,并保持与使用整个数据集获得的三维重建质量相当的回归 - 特征选择与超参数优化的改进遗传算法:垃圾邮件预测中的 XGBoost 案例
近期,网上社交网络的垃圾邮件引起了研究和商业界的关注。本文提出了一种改进的遗传算法用于同时减少维度和超参数优化,针对不平衡数据集。该算法使用极限梯度提升分类器对推文数据集进行特征空间降维,生成垃圾邮件预测模型,并验证了模型的有效性。实证结果