混合曲率决策树与随机森林

Jun, 2024

Mixed-Curvature Decision Trees and Random Forests

Philippe Chlenski, Quentin Chu, Itsik Pe'er

TL;DR我们扩展了决策树和随机森林算法到混合曲率的产品空间，并在该研究中展示了通过在产品流形中进行简单、表达丰富的分类和回归来克服已有限制，并证明了与环境空间中的欧氏方法相比，在覆盖了各种曲率的组分流形和产品流形上具有卓越的准确性。

Abstract

We extend decision tree and random forest algorithms to mixed-curvature product spaces. Such spaces, defined as Cartesian products of Eucl

decision tree random forest product spaces manifolds classification

发现论文，激发创造

快速双曲线决策树算法

本研究介绍了一种基于超几何决策树算法的新方法 hyperDT，通过在超几何空间中利用内积来使得决策树算法适用于超几何空间，从而消除了计算密集型的 Riemannian 优化和数值不稳定的指数对数映射。我们的方法简单易懂，决策复杂度恒定，同时减轻了高维欧几里得空间中固有的可扩展性问题。在此基础上，我们提出了一个超几何随机森林模型 hyperRF，通过在多样化数据集上进行广泛比较，验证了这些模型的优越性能，为超几何数据分析提供了一个快速、精确、准确和易于使用的工具。

Oct, 2023

双曲随机森林

通过使用水平面将随机森林推广到双曲空间，使用大边际分类器找到候选分割，再结合子类最低共同祖先和类平衡的大边际损失方法，可以解决多类数据和不平衡实验问题，并且在标准和新的基准测试中表现优于传统随机森林算法和最近双曲分类器。

Aug, 2023

曲率聚焦：用于图形表示学习的混合曲率 Transformer

我们提出了一种基于全曲率空间的完全产品百叶窗变换器，结合了 tokenized 图变压器，通过端到端的方式学习适合输入图的曲率，以及一种核化的非欧几里得注意方法，实现了线性时间和内存成本与节点和边的数量成线性关系的模型在非欧几里得域的功能扩展。实验结果表明将变形器推广到非欧几里得域的好处。

Sep, 2023

利用加权混合曲率积流形改进异质图学习

本研究通过加权产品流形的数据驱动方法，可以更准确地表示异构图的结构，并从输入数据中学习出更好的图表示，以在多个下游任务中获得更好的性能。

Jul, 2023

比较模型空间的产品流形的 Gromov-Hausdorff 距离

为了改善模型性能，最近的研究提出通过使潜空间的几何特征与基础数据结构对齐来提升机器学习模型。本文引入了一种使用 Gromov-Hausdorff 距离计算候选潜空间几何之间距离的新概念，提出了使用估计的 Gromov-Hausdorff 距离来搜索最佳潜空间几何的图搜索空间算法。本文描述了计算模型空间之间 Gromov-Hausdorff 距离的算法及其计算实现。

Sep, 2023

极超伪双曲表示学习

本文提出了一种基于常曲率伪黎曼流形的表示方法，适用于非欧几里德结构数据的机器学习。该方法的优化方法及应用于图表示的实验结果也被给出。

Jul, 2020

基因途经学习的产品流形表征

通过将途径图嵌入非欧几里得的混合曲率空间中，我们研究了它对生物领域中的基础图谱嵌入的影响，与传统的欧几里得图谱学习模型进行了比较，并利用学到的节点嵌入训练了一个监督模型，用于在途径图中预测缺失的蛋白质相互作用。我们发现，使用混合曲率嵌入和相应的图神经网络模型可以显著减小失真，并提高在分布内边缘预测性能，但在分布外边缘预测性能上不及现有基准模型，这表明这些嵌入可能会过拟合训练图的拓扑结构。

Jan, 2024

黎曼流形回归的共形推断

这项研究通过在流形上进行回归、流形统计学等探究，提出了一种在响应变量位于流形、协变量位于欧几里得空间情况下的回归预测方法，该方法基于非参数的分布自由概念，通过证明流形上经验预测区域与总体预测区域近似几乎必然收敛来展示其高效性。通过综合模拟研究和实际数据分析进行了验证。

Oct, 2023

神经潜在几何搜索：通过格罗莫夫 - 豪斯多夫信息贝叶斯优化进行产品流形推断

通过使用不同的几何结构，如双曲空间、球面空间和综合空间，利用神经潜空间几何搜索方法（NLGS），能够显著提高机器学习模型的性能，并能够自动识别下游任务的最佳潜空间几何。

Sep, 2023

紧凑图表示的重叠空间

本文介绍了一种不需要寻找最佳配置可能的重叠空间，它允许不同类型的空间 (欧几里得、双曲和球形) 之间共享坐标子集。此外，重叠空间允许更紧凑的表示，因为它们的几何更加复杂。通过使用重叠空间，在图形嵌入和信息检索任务中取得了最佳结果。

Jul, 2020