- FSDR:一种基于离散松弛的伪时间序列数据的新型深度学习特征选择算法
利用离散松弛学习的深度学习算法 FSDR,针对伪时间序列(PTS)数据中的特征选择问题,实验证明 FSDR 在考虑执行时间、$R^2$ 以及 $RMSE$ 的平衡时,优于其他三种常用特征选择算法。
- 相对内在维度与学习的内在性
高维数据具有令人惊讶的特性:仅使用简单的线性分类器就可以高概率地将数据点配对分开,甚至从任意子集中分离出来。我们引入了数据分布的内在维度的新概念,精确地捕捉了数据的可分离性质。对于这个内在维度,以上的经验法则成为一条规律:高内在维度保证了数 - TensorBank:基于张量的湖仓系统用于基础模型训练
基于复杂的关系查询,TensorBank 是一个能够从云对象存储流式传输张量到 GPU 内存的 PB 级张量湖,使用 HSI 进行查询加速,并且可以使用 PyTorch 转换对数据进行处理,该架构适用于各种用例包括自然语言处理、计算机视觉、 - 张量回归
回归分析是数据分析和机器学习领域的关键研究领域之一,它致力于探索变量之间的依赖关系,通常使用向量进行表示。高维数据的出现带来了传统数据表示方法的挑战,而张量作为向量的高维扩展,被认为是高维数据的自然表示。本书对基于张量的回归模型及其应用进行 - 防御音乐推荐系统免受基于中心性的对抗攻击
本研究提出了一种基于 Mutual Proximity 的新型防御机制,用于保护高维数据空间中运行的音乐推荐系统免遭针对其漏洞的攻击,实验结果表明,该方法能显著提高推荐系统的鲁棒性并降低攻击成功率。
- 高维贝叶斯网络结构学习的并行抽样
该研究论文介绍了一种使用候选父集进行并行采样的近似算法,可以被视为高维数据结构学习的现有算法(MINOBS)的扩展,命名为并行采样 MINOBS (PS-MINOBS)。实验结果表明,与有运行时间限制的 MINOBS 相比,该算法在大多数情 - MM适用于最优宇宙学分析的平移和旋转等变归一化流 (TRENF)
本文提出了一种基于 Translation 和 Rotation 的 Equivariant Normalizing Flow (TRENF) 模型,该模型能够作为生成模型并为高维数据提供完整的似然函数,在宇宙学的应用中,通过使用宇宙学参数 - KDD通过成对置换算法实现可解释模型
本文提出了一种名为 “pairwise permutation algorithm” 的新方法,旨在缓解高维生物数据集中特征之间的相关性偏差对特征重要性评估的影响,并在玩具数据集和微生物组数据集中进行验证。
- ICLR超越基于类别的图像分类标签表述
通过对不同标签表示方法的比较,发现高维度、高熵标签表示方法在图像分类任务中具有与文本标签表示方法相当的准确性,但在对抗攻击以及在有限的训练数据上表现更为鲁棒和有效,这提示标签表示方法在机器学习中具有重要作用。
- ICML学习斯坦差异以训练和评估能量模型,而无需进行抽样
我们提出了一种评估和训练非归一化密度模型的新方法,该方法仅需要访问非归一化模型的对数密度的梯度,并使用神经网络参数化数据的向量函数 q (x),通过估算数据密度 p (x) 与模型密度 q (x) 之间的 Stein 差异来进行模型拟合和拟 - 多尺度去噪得分匹配在高维空间中学习能量基模型
本文提出一种利用多尺度去噪得分匹配的能量模型 (Energy-Based Model, EBM),并利用多噪声级别的数据进行训练。该模型在高维数据的样本合成和密度估计方面取得了与 GAN 相当的性能,并在图像修复任务中表现良好。
- ICML随机函数先验用于相关建模
借助经验变分推理技术,本文提出一种基于贝叶斯非参数方法的隐变量模型 ——population random measure embedding (PRME),并应用于高维数据的建模与推断。
- 高维度、低样本量数据完美聚类
本文针对高维低样本量情况下聚类算法性能下降的问题,介绍了一种基于云图的 MADD 差异度量方法,并证明了其在高维数据聚类上的有效性;根据理论和实验结果,比较了多种算法及其聚类效果评估方法,发现在使用 MADD 代替欧氏距离时,已有算法的表现 - 一种可扩展的非线性非高斯数据条件独立性检验方法
提出一种新的 O (N^2) 条件相关独立性检验方法 (CC I),比使用核复现希尔伯特空间 (KCI) 方法计算要快得多,对高维度数据集适用,并且在处理复杂的非线性、非高斯数据集时,比 Harris&Drton(2012)方法以及偏相关度 - ICML多输出预测中的地标选择方法
研究了当响应变量 y 为高维时,基于选择维度 y_L 的子集,逐步通过建模 x 到 y_L 和 y_L 到 y 的两个部分来构建多输出条件模型 x 到 y,并在多标签分类和多变量回归实验中表现出优越性。
- 密度敏感哈希
提出了一种名为密度敏感哈希(DSH)算法,它是局部敏感哈希(LSH)的扩展,利用数据的几何结构避免了纯随机投影的限制,并在大规模高维数据搜索中取得更好的性能。
- 广义基于树形结构的小波变换
本文提出了一种可应用于图形、高维数据和网络上定义的函数的新小波变换。提出的方法借鉴了 Haar 小波变换的思想,并利用一种分层的树结构来捕捉输入数据的几何和结构。该文还将提出的变换应用于图像去噪,并展示了该方法的实用性。
- 子高斯随机矩阵的受限特征值条件
本文探讨了一类随机矩阵是否满足 Restricted Eigenvalue 条件,引入了额外的协方差结构,借助几何泛函分析的工具来分析样本复杂性,并了解其对高维数据的统计影响。
- 寻找高维数据中的大平均子矩阵
本文介绍了一种名称为 LAS 的统计学动机的双聚类方法,它能够在给定的实值数据矩阵中找到大的平均子矩阵,通过验证研究得出,该方法是探索高维数据中发现生物学相关结构的有效工具。