丰富的基于树的分类器:利用导数和几何特征的创新方法
本文使用符合预测技术计算功能数据的同时预测带和聚类树。我们使用多个新颖的一致性分数来简化计算,并且在不假设任何分布的情况下,为基础随机过程提供了预测集,并提供信息指向潜在进程的高密度区域。
Feb, 2013
本研究旨在将广泛应用于有限维数据的孤立森林(Isolation Forest)方法扩展到函数数据,以便更准确地检测出复杂基础设施的异常情况,并提出了基于IF算法的函数统计深度方法和多元函数扩展。
Apr, 2019
本文提出了一种非线性函数对函数的降维方法,使用连续神经元的连续隐藏层来学习函数数据中固有的结构,通过降低函数特征数和观测时间点数来得到一个低维的潜在表征,从而在时间序列的维度缩减方面取得了比目前方法更好的效果。
Jan, 2023
本研究提出了一种新颖的mfDNN分类器,用于处理高维函数观测数据,采用稀疏深度神经网络架构,并采用ReLU激活函数和交叉熵损失函数来最小化多分类分类设置的风险函数。我们证明了mfDNN在模拟数据和不同应用领域的基准数据集上的性能。
May, 2023
该论文介绍了一种名为FSFC(适用于功能分类的特征选择)的新方法,它解决了在具有分类响应和纵向特征的情况下同时执行特征选择和功能数据分类的挑战。通过集成逻辑损失和功能特征来识别分类的最重要特征,该方法利用功能主成分和自适应版增广拉格朗日算法解决了最小化过程,实现了高维数据的高效处理,并且在计算时间和分类准确率方面优于其他机器学习和深度学习方法。
Jan, 2024
在大多元和不完整数据时代,需要一个能够计算可行地估计特征之间统计依赖并处理缺失值的方法。我们开发了MUDRA(多元FLDA的多元版本)来解决这个问题,并描述了一种高效的期望/条件最大化算法来推断其参数。我们在“Articulary Word Recognition”数据集上评估了MUDRA的预测能力,并展示了其在处理缺失数据时相对于最先进方法的改进。MUDRA允许解释性地对具有大量缺失数据的数据集进行分类,这在医学或心理数据集中尤其有用。
Feb, 2024
功能数据分析(FDA)是用于建模和分析时间域函数数据的框架,在该领域中,集成学习的功能分类器只是最近引起了极大的兴趣。该论文的重点是基于功能数据的集成学习,展示了如何使用不同的功能表示来训练集成成员,并通过多数投票来组合基模型的预测结果。所提出的功能投票分类器(FVC)证明了不同的功能表示可以增加多样性从而提高预测准确性。使用多个真实世界数据集显示,与单个模型相比,FVC可以显著提高性能。这个框架为功能数据的投票集成提供了基础,并在FDA领域激发了一个非常有潜力的研究方向。
Mar, 2024
本研究解决了功能随机森林(FRF)模型透明度和可解释性不足的问题。提出了一系列新的解释工具,如功能部分依赖图和功能主成分概率热图,以增强FRF的可解释性。通过对心电图数据集的应用,验证了这些工具在揭示关键模式和改善模型解释性方面的有效性。
Aug, 2024
本文提出了一种新的监督分类策略,将功能数据分析与基于树的方法结合,旨在解决高维数据带来的挑战,并提升现有功能分类器的分类性能。我们提出的增强型功能分类树和功能随机森林显著提高了功能主成分的重要性评估方法,可以在处理由连续导数引起的相关特征时,提供无偏的置换特征重要性,实验结果表明该方法在真实和模拟数据集上均具有显著的预测能力提升。
Aug, 2024
本研究针对环境时间序列分析中功能数据分析和集成学习的有效性问题,提出了一种新算法——随机样条树(RST),通过将随机功能表示融合到随机森林框架中,以增强决策树的多样性。研究结果表明,RST在多个环境时间序列分类任务中显著超越了标准随机森林和梯度提升方法,分类准确率提高了多达14%。
Sep, 2024