- 耦合输入输出维度缩减:应用于目标导向的贝叶斯实验设计和全局敏感性分析
在这篇研究论文中,我们引入了一种新的方法来同时降低输入和输出空间的维度。我们的联合方法支持目标导向的维度减少,其中输入或输出的感兴趣数量被预设。我们特别考虑了目标导向的传感器放置和目标导向的灵敏度分析,可以视为选择最重要的输出或输入组件的维 - Wasserstein 度量空间中的规范变量
本文提出了一种基于 Wasserstein 度量的分布化空间中的实例分类方法,其中包括使用 k 最近邻算法、k 均值聚类和伪混合建模等基于距离的分类算法。通过最大化 Fisher 比例的原则,通过迭代算法在向量空间中进行比例最大化来实现此方 - 输入引导的多解构单重建神经网络模型用于矩阵分解
基于非负矩阵分解(NMF)概念的 IG-MDSR-NMF 和 IG-MDSR-RNMF 模型,通过发现数据的低秩近似,处理高维数据,并确保模型的非负性约束。与其他九种降维算法相比,两个模型在五个常用数据集上表现出明显的优越性,通过保证数据的 - 最小卷积潜空间中带有条件 Sinkhorn 生成对抗网络的贝叶斯反问题
利用最少体积这一新颖的非监督非线性降维方法解决高维、非线性和模型不确定性等问题,从而实现后验推断,为逆问题提供了潜在条件生成模型的训练方法。
- ICML神经崩溃与差分隐私:NoisyGD 实现近乎完美的表示学习的奇异行为
通过在公共数据集上进行预训练的大规模表示学习显著增强下游任务中的差分隐私学习,神经坍塌现象的理论解释,研究不同预训练模型下的特征质量及差分隐私微调的鲁棒性问题,以及采用特征归一化和维度降低方法改善差分隐私微调的策略。
- 基于正则化自编码器的 DIRESA,一种保持距离的非线性降维技术
使用基于自编码器神经网络的维度缩减技术,通过 DIRESA 架构来压缩大气候和天气数据集,并在压缩的潜在空间中进行可解释的搜索,从而提供物理洞察力和降低在线存储需求。
- 芯片晶圆地图缺陷模式的迭代集群采摘
通过特征提取、维度削减和聚类等步骤,本论文提出了一种针对半导体晶圆映射缺陷图案的无监督聚类方法,其中创新之处在于通过筛选轮廓分数选择性过滤聚类来改善聚类性能,尤其适用于困难的缺陷图案,并在实际工业数据集上对比了文献中的相关方法并展示了改进的 - 地铁客流建模的低秩稳健子空间张量聚类
本研究提出了一种基于张量的子空间聚类和异常分解技术,旨在同时实现高维张量的异常鲁棒降维和聚类。通过结合 Tucker 分解、稀疏异常分解和子空间聚类,提出了一个新的低秩鲁棒子空间聚类分解模型,并通过块坐标下降算法更新参数。实验证明,该方法在 - 利用类别和特征质心增强降维散点图
通过使用由降维得到的 x 和 y 坐标来计算类别质心和特征质心并将其叠加在散点图上,本研究解决了将 x 和 y 轴的含义解释复杂性的问题,展示了这种方法在三种神经遗传疾病表型数据中的应用及类别质心和特征质心的添加如何增加散点图的可解释性。
- 对属性选择中多元对称不确定性的样本代表性
通过统计模拟技术分析了多变量对称不确定性(MSU)测量的行为,观察了属性数目、基数和样本大小对 MSU 的影响,并提出了一种在这三个因素不同组合情况下保持 MSU 良好质量的启发式条件,为推动维度缩减过程提供了有用的标准。
- 未知故障模式下的退化建模与预测分析
该研究提出了一种基于降维技术 UMAP 的故障模式诊断方法,通过将每个单元的退化轨迹投影和可视化到低维空间,并利用这些退化轨迹开发基于时间序列的聚类方法来识别训练单元的故障模式。最后,引入一种具有单调约束的预测模型,能够同时预测测试单元的故 - 衍生增强的深层算子网络
深度运算符网络 (DepthONets) 是一类学习函数空间之间映射的神经运算符,最近已被发展成为参数化偏微分方程 (PDEs) 的替代模型。本文提出了一种增强导数的深度运算符网络(DE-DepthONet),利用导数信息提高预测精度,尤其 - GT-PCA:高效且可解释的降维方法 —— 具有一般转换不变性的主成分分析
引入广义变换不变主成分分析(GT-PCA)作为主成分分析(PCA)和自编码器的一个有效而可解释的替代方法。通过提出的神经网络,高效地估计主成分,并提供了基于合成和真实数据的实验证明了 GT-PCA 明显优于其他方法。
- 差分隐私切片逆回归:极小极大优化和算法
在高维数据分析中,隐私保护已成为一个关键问题,Li (1991) 提出的切片逆回归技术作为一种广泛应用的统计技术,用于降低协变量维度并保持足够的统计信息。本文提出了专门针对充分维度减少情况下隐私问题的最优差分隐私算法,并建立了在低维和高维环 - 基于核嵌入的函数深层神经网络的非线性函数回归
利用平滑核积分变换的思想,我们提出了一种功能深度神经网络,其具有高效和完全依赖数据的降维方法。我们的功能网络的架构包括核嵌入步骤、投影步骤和表达深度 ReLU 神经网络,利用平滑核嵌入使其具有离散不变性、高效性和对噪声观测的鲁棒性,能够利用 - 联邦多线性主成分分析及其在预测学中的应用
本文提出了一种联邦多线性主成分分析(FMPCA)方法,使多个用户能够协同减少张量数据的维度,同时保持每个用户的数据本地和机密,该方法保证与传统 MPCA 方法具有相同的性能,还演示了在工业预测中应用提出的 FMPCA 方法,通过模拟数据和现 - 主成分分析加速实时处理高光谱图像的检测和识别准确度
实时高光谱检测中采用主成分分析进行降维可以加速处理时间,并且通过减少主成分数量可以在不显著降低检测率的情况下进一步减少处理时间。
- 可微分的 VQ-VAE 用于稳健的白质纤维束编码
本文提出了一种新颖的可微分量化变分自编码器,用于对整个束流进行降维编码和信任度分析,并与几种现有的自编码器进行了比较,展示了在编码和合成方面的卓越性能。
- 流形学习:是什么,怎么做,为什么
Manifold learning is a set of methods to find the low dimensional structure of data, allowing visualization, de-noising, - 小而强大:使用小适配器对 ViTs 进行微调
通过引入适配器逐步减小其尺寸的方法,我们提出了 MiMi 训练框架,该框架能够在降低计算和存储成本的同时保持高性能,通过适配器层间神经元重要性的比较来自动估计每个适配器的隐藏维度,我们的方法在三个数据集基准 DomainNet、VTAB 和