用平行坐标轴发现可解释的机器学习模型

May, 2023

用平行坐标轴发现可解释的机器学习模型

Parallel Coordinates for Discovery of Interpretable Machine Learning Models

Dustin Hayes, Boris Kovalerchuk

TL;DR通过并行坐标系中的视觉知识发现，使用混合和纯超块（HB），以及建议在超算法中使用混合和纯超块，利用 UCI ML 库的基准数据评估结果，建立超块、降维和可视化之间的连接，并提出了一种新的方法来可视化具有缺失值的不完整 n-D 数据。

Abstract

This work uses visual knowledge discovery in parallel coordinates to advance methods of interpretable machine learning. The graphic data r

visual knowledge discovery parallel coordinates hypercubes hyperblocks interpretable machine learning

发现论文，激发创造

通用线坐标下的视觉知识发现

通过基于不同形式的无损通用线坐标的视觉知识发现方法，本文提出了一种新的方法来生成，解释和可视化非线性分类器。该方法可以在提高解释性和准确性的同时与其他常见的计算机算法相竞争，并且可以从超块中构建准确且高度可解释的模型和规则。

May, 2023

2 维无损可视化空间中的高维可理解学习

本研究探讨了在二维可视化空间（2-D ML）中使用非损失通用线坐标的视觉知识发现来进行机器学习分类任务的新方法。研究表明，这是一种完整的机器学习方法，不需要在抽象的 n 维空间中处理 n 维数据。利用二维中 n 维数据的图像表征，可以在二维空间中发现 n-D 模式而不会丢失 n-D 信息。具体而言，本研究显示了如何使用不同的 In-line Based Coordinates 进行分类和回归，并展示了两个基于基准数据集（威斯康星州乳腺癌和页面块分类数据集）的案例研究。最后，本研究基于页面块分类数据的特点，开发了一种利用决策树作为模型设计辅助工具的算法，可应用于处理高分辨率多类不平衡数据。该方法加速了一个新兴领域（完整的 2-D 机器学习和其方法论）的发展，并为最终用户提供了模型自助发现和解释的可能性

May, 2023

对比多视角双曲分层聚类

本论文提出了一种基于神经网络的模型（Contrastive Multi-view Hyperbolic Hierarchical Clustering, CMHHC），应用于多视角数据的超几何层次聚类，通过对多个视角的样本级表示进行对比来捕获不变性信息，并将其嵌入到超几何空间中进行聚类，并且将最优化的超几何嵌入解码成二分聚类树结构。实验结果表明该方法及其组成部分的有效性。

May, 2022

超维度计算：生物数据的快速、稳健和可解释范式

生物信息学中的关键词为：算法、深度学习、超维计算、组学数据。本文总结并探索了超维计算在生物信息学中的潜力，强调了其效率、可解释性和处理多模态和结构化数据的能力。超维计算对于组学数据搜索、生物信号分析和健康应用具有巨大的潜力。

Feb, 2024

生成式超图聚类：从块模型到模块度

本文提出了一种基于泊松度校正超图随机块模型（DCHSBM）的聚类方法，该方法利用最大似然推断来实现超图聚类，其聚类目标扩展了图的流行性目标，使用了一种新的基于节点整合的变化，具有高可扩展性。通过综合分析各种实验数据，包括学校联系网络、U.S. 国会议案、合作购买行为的产品类别和网站浏览会话的酒店位置，作者发现该聚类方法能够恢复具有相应高阶结构的真实聚类。

Jan, 2021

可解释的超矩形集合作为基模型

本文提出了一种新的基于集成的模型，使用均匀生成的轴平行超矩形为基模型。该模型可以避免过拟合，并使用梯度提升机来整合这些简单的基模型。同时，我们还研究了优化集成模型参数的方法和新的正则化方法，并使用 SHAP 方法解释了我们的集成模型。数值实验表明，我们的方法在回归和分类问题上能够取得良好的效果。

Mar, 2023

一次性图表示学习基于超维计算

我们提出了一种新颖、简单、快速且高效的用于图像半监督学习的方法，该方法利用超高维度计算将数据样本编码成高维空间，并且通过 Hyper-dimensional Graph Learning 算法可以在图神经网络的节点表示上利用这种超高维度性质来实现信息聚合，从而取得与深度学习方法相媲美的预测性能，而无需进行计算昂贵的训练过程。

Feb, 2024

基于高维度图分类的分子分类

我们的研究引入了一种创新的基于超维计算的图学习方法，与图神经网络和 Weisfieler-Lehman 图核心相比，在癌细胞识别等应用领域取得了可比拟的结果，并且在训练和推断阶段实现了显著的加速和资源效率的提升。

Mar, 2024

可视化重叠双聚类和布尔矩阵分解

本文研究如何针对重叠聚类进行双分图可视化问题，并提出能够满足近距离聚类元素、连续区域聚类元素和大范围不间断设计限制的目标函数和算法，并在实际数据集上进行实验，发现最佳结果采用局部放置相似聚类成员行列的新型启发式算法。

Jul, 2023

通过隐式正交性偏好发现对称群结构

HyperCube 网络引入了一种新的方法来自主发现数据中的对称群结构，该方法利用了唯一因子化架构和新颖的正则化器，以朝向学习正交表示的有力归纳偏置，并成功地从部分观察到的数据中高效地学习了一般的群操作，同时恢复了完整的操作表，这些因子直接对应于底层群的精确矩阵表示，而且这些因子捕捉到了群的完整不可约表示集合，形成执行群卷积的广义傅里叶基础。大量与群和非群符号操作的实验显示，与 Transformer 基准相比，HyperCube 在训练速度上表现出了显著的 100-1000 倍改进和 2-10 倍的更高样本效率，这些结果表明我们的方法开启了一类能够利用数据内在对称性的深度学习模型，从而在性能和广泛适用性上取得了显著的改进。

Feb, 2024