- 超级学习者中变量筛选的实际考虑
预测函数估计是许多数据分析的基本组成部分。Super Learner 集成是一种特定的层叠实现,具有可取的理论性质,并已成功应用于许多领域。在拟合其他预测算法之前,可以通过在集成中使用包括 Lasso 在内的变量筛选算法来实现维度降低。然而 - 小样本分类问题的规范最优近似学习
小数据学习问题是响应变量观察数量有限和特征空间维度庞大之间存在显著差异,我们提出降维、分割特征空间和分类问题的高度优化近似学习算法(GOAL 算法)作为潜在解决方案,并通过实验证明其在学习性能和计算成本上优于其他当前最好的机器学习工具。
- 高效可视化大型图
本文介绍了一种基于降维的新颖图形可视化方法,称为 t-SGNE。t-SGNE 专门设计用于可视化图中的聚类结构,并通过使用图的邻居结构将时间复杂度从二次降低到线性的方式,支持更大规模的图。此外,结合拉普拉斯特征图嵌入算法和图中的最短路径算法 - 具有统计保证的随机降维
研究论文通过研究快速执行和数据利用的算法,探索了大型模型和数据利用的有效维度减少策略,以及提高泛化和分布鲁棒性的数据增强方法。
- 在线自适应马氏距离估计
本文介绍了在 Mahalanobis 距离中应用草图技术加速算法的研究,提供了适用于 Mahalanobis 距离的数据结构,可处理自适应查询和在线更新,并与在线学习 Mahalanobis 度量的先前算法相结合。
- 通过矩阵分解的视觉 Transformer 剪枝
通过使用矩阵分解实现视觉转换器修剪,该论文进一步在保留重要特征的基础上,比较了多种矩阵分解方法,最终选择奇异值分解作为降维和计算复杂度减少的方法,通过与原准确率得分进行比较实现目标。
- 图像异常检测的启发式超参数选择
图像中的异常检测是一个基本的计算机视觉问题,我们提出了一种减少特征维度的算法,并利用预训练模型提取的深层特征进行异常检测,以提高性能和降低计算成本。
- 通过动态模态分解学习非自治系统
本研究提出了一种基于动态模态分解(DMD)的面向未知非自治动态系统时间依赖输入的数据驱动学习方法,该方法利用本地参数化外部时间依赖输入的修正系统作为原始非自治系统的近似,包括一系列本地参数化系统,可以通过参数空间中的降维和插值框架(DRIP - 使用置换辅助的熵维度降低线性可扩展学习平滑低维模式
该研究介绍了一种基于欧式平滑度作为模式质量标准的无监督熵正则化迭代优化问题,能够高效地从高维数据中提取出稀疏的、经过排列的低维平滑模式,有效地实现了降维和特征提取,且在实际应用中能够识别同时最小化破产风险的平滑转换模式。
- 高效稳健的贝叶斯超参数选择方法在降维可视化中的应用
本研究提出了一个有效且强健的自动调参框架,用于在大型数据集和任意性能指标下进行降维算法的超参数选择,利用贝叶斯优化和代理模型,该方法使得超参数选择具有多目标权衡的效率,并允许我们进行数据驱动的敏感性分析。通过添加归一化和子采样,该框架表现出 - 通过 Johnson-Lindenstrauss 矩阵进行标签嵌入
本文介绍一种基于 Johnson-Lindenstrauss 矩阵的极端多类分类的简单可拓展的框架,该框架使用 JLM 的列来嵌入标签,将分类问题转换为具有对数 C 输出维度的回归问题,并通过冗余分析,揭示了计算效率和预测精度之间的折衷关系 - 稀疏线性动态单臂赌博问题的协作阈值套索算法
本文提出了一种用于解决多智能体稀疏背景下的上下文线性赌博问题的新方法,通过使用 Lasso 回归进行维度缩减、回归进行问题解决、结合特定过程和网络结构共享信息,达到降低通信成本、保证最小累计遗憾值的效果,并在合成和真实场景下验证了方法的有效 - 电容式感应设备的灵活手势识别:在职适应
本文介绍了一种手势识别技术,使用嵌入式电容传感器生成实时信号并利用机器学习技术分析时间序列信号以识别五个手指的三个特征,其性能可与监督式可变自编码器等更高级的方法相媲美,并能通过自适应的误差校正机制进一步提高其分类性能,从而证明了运用此技术 - Cayley 变换下的椭球拟合
本文提出一种基于 Cayley 变换的椭球拟合算法,可以适应各种维度和任意的椭球形状,且比其他方法表现更好,该算法应用于降维、数据可视化和数据聚类,并能识别非线性特征。
- 大规模数据的自权重多视角聚类
本文介绍了一种自动加权的多视角聚类算法,使用矩阵分解来解决维度固定的一致系数矩阵和视角特定基矩阵的限制,并采用六步交替优化算法进行优化,最终的聚类结果表现出优异的性能。
- 减少深度卷积激活特征 (R-DeCAF) 在组织病理学图像中用于提高乳腺癌诊断分类性能
本文提出一种基于深度卷积神经网络(DCNN)的计算机辅助诊断(CAD)方法,使用不同的降维方法组合 DCNN 的特征,提高二分类任务的准确性。实验结果表明,在 BreakHis 数据集上,使用预训练 AlexNet 作为特征提取器和线性降维 - 时间序列的双向降维的一种函数方法
本文提出了一种非线性函数对函数的降维方法,使用连续神经元的连续隐藏层来学习函数数据中固有的结构,通过降低函数特征数和观测时间点数来得到一个低维的潜在表征,从而在时间序列的维度缩减方面取得了比目前方法更好的效果。
- EVNet:一种可解释的深度降维神经网络
本论文提出了一种深度神经网络方法(称为 EVNet),用于实现可解释性和结构可保持的降维,该方法基于数据扩增和基于流形的损失函数,在维持准确度和完整性的同时提供解释性,同时整合了视觉界面,以帮助用户调整 EVNet 以实现更好的性能和解释能 - MM一种用于评估和结合多种数据可视化的光谱方法
本文提出了通过谱方法评估和组合由多个算法产生的数据集的多个可视化的有效方法,并提高了捕捉底层真实数据结构的质量。
- 一种用于维度估计的加性自编码器
本文针对降维问题提出并分析了一种由序列化偏差估计、线性趋势估计和非线性残差估计组成的增量自编码器。实验结果表明,仅通过浅层网络封装非线性行为的自编码器能够识别具有低自编码误差的数据集的内在维度。该研究进一步比较了深层和浅层网络结构及其训练方