- 基于随机森林的贝叶斯校准随机代理模型
该研究使用基于随机森林的代理模型技术加速评估传染病流行模型,并通过 Markov 链蒙特卡罗方法对一种名为 CityCOVID 的流行病学模型进行校准,以提高其预测性能。
- QC-Forest:一种经典 - 量子算法,可证明加速随机森林的重新训练
QC-Forest 是一种经典 - 量子算法,用于在流式设置中高效地重新训练随机森林模型,实现多类分类和回归,其运行时间与累积样本总数的对数成倍数关系。
- 可解释人工智能用于入侵检测模型的比较分析
本研究通过使用遮挡敏感性方法,对二元和多类别分类的入侵检测任务中的各种机器学习模型进行了分析,使用相同的数据集。我们发现,大多数分类器仅利用少于三个关键特征就能实现高准确性,表明有效的特征工程对于入侵检测可能比应用复杂模型更为重要。我们还发 - 混合曲率决策树与随机森林
我们扩展了决策树和随机森林算法到混合曲率的产品空间,并在该研究中展示了通过在产品流形中进行简单、表达丰富的分类和回归来克服已有限制,并证明了与环境空间中的欧氏方法相比,在覆盖了各种曲率的组分流形和产品流形上具有卓越的准确性。
- 朴素贝叶斯和随机森林用于农作物产量预测
本研究分析了 1997 年至 2020 年期间印度的作物产量预测,重点关注各种作物和关键环境因素。利用线性回归、决策树、KNN、朴素贝叶斯、K 均值聚类和随机森林等先进的机器学习技术来预测农业产量。尤其是朴素贝叶斯和随机森林模型通过数据可视 - 评估医学诊断中机器学习模型的解释能力:一种人机协同的方法
这篇论文综合研究了决策树、随机森林和 XGBoost 模型在胰腺癌数据集上的解释能力评估,并使用人机协同相关技术和医学指南作为领域知识的来源,以确定与胰腺癌治疗相关的不同特征的重要性。同时,这些特征不仅用于机器学习模型的降维,还用于使用无偏 - Forest-ORE:挖掘最佳规则集合解释随机森林模型
通过优化的规则集合 (ORE) 使随机森林 (RF) 变得可解释,通过权衡预测性能、可解释性覆盖率和模型大小的权衡,提供了优秀的预测性能、可解释性覆盖率和模型大小的平衡。
- 一种新的基于直觉模糊决策树的随机森林集成
本文提出了一种基于直觉模糊随机森林(IFRF)的新型随机森林集成方法,结合了模糊逻辑和模糊集合的灵活性、随机抽样和特征选择的随机性以及多个分类器系统的鲁棒性,对复杂条件下的分类问题具有竞争力和优越性能。该方法通过使用直觉模糊信息增益选择特征 - 超越节拍:歌曲流行的诀窍?一个机器学习方法
探索使用机器学习模型预测歌曲流行度的能力,以分析歌曲特征及其对流行度的影响,发现流派是主要的影响因素之一,尤其是电子舞曲,在预测流行度方面,随机森林模型表现最为有效。
- 训练的随机森林完全揭示您的数据集
我们介绍了一种基于优化的重建攻击,能够完全或近乎完全重建用于训练随机森林的数据集。我们将重建问题定义为一个组合优化问题,并通过最大似然目标函数来解决。通过广泛的计算研究,我们证明了即使在小规模树集的情况下,使用特征随机化的随机森林也容易被完 - 基于深度学习的语音和视觉合成,通过多层自适应框架改进网络钓鱼攻击检测
我们提出了一个可适应的框架,结合深度学习和随机森林,在不同预测层次上从图像中读取、合成深度伪造视频的语音以及进行自然语言处理,以显著提高机器学习模型对钓鱼攻击的检测性能。
- 不平衡遗传数据的改进分类和回归性能的数据预处理方法、特征选择技术和机器学习模型的比较分析
通过研究数据的预处理、特征选择技术和模型选择对机器学习模型在基因数据集上的性能进行了调查,发现在回归任务中,异常值或偏斜的预测变量和目标变量对模型性能没有造成挑战;而分类任务中,类别不平衡的目标变量和偏斜的预测变量对性能几乎没有影响。随机森 - 应用机器学习于组学数据
在这篇论文中,我们介绍了在组学数据背景下一些机器学习技术的使用。我们具体评估了随机森林和惩罚性多项逻辑回归在胰腺癌的基因组学和免疫组学整合分析中的应用,并提出了使用关联规则来解决之前提到的模型的较低预测能力问题。最后,我们将这些方法应用于由 - 利曼 - 勒贝格回归森林
我们提出了一种新的集成方法,称为 Riemann-Lebesgue Forest (RLF),用于回归问题,通过在非终止节点上从响应 Y 或特征空间 X 中的方向来对节点进行划分。通过模拟数据和真实世界数据的实验证明了 RLF 相对于原始随 - 机器学习分类过程中数据抽象方法的重要性对于关键决策
研究通过开发数据抽象协议,将小样本和不完整数据的分类能力提高至最优,通过比较使用随机森林作为基准的可解释方法,发现 Small and Incomplete Dataset Analyser 在数据不完整的情况下能够始终保持高准确性。
- 利用机器学习技术识别前臂肌肉信号中的手势
研究使用前臂肌电数据来区分八种手势,采用神经网络和随机森林算法对来自十个参与者的数据进行分析。神经网络在 1000 毫秒窗口下达到了 97% 的准确率,而随机森林在 200 毫秒窗口下达到了 85% 的准确率。更大的窗口大小提高了手势分类的 - 基于轨迹和细胞命运信息的细胞身份预测
利用机器学习方法,我们提出了一种创新的方法来在早期 C. elegans 胚胎发育期间对细胞进行识别,通过利用细胞轨迹和细胞命运等少量时间空间特征,我们的模型能够在有限数据下实现 90% 以上的准确率,并能解释最重要的特征对生物知识的意义。
- 改进足球模拟 2D 游戏中的传球预测的工程特征
使用深度神经网络和随机森林模型,研究了 Soccer Simulation 2D 游戏中足球 2D 球员的传球行为,并验证了该方法对提高传球预测性能的有效性。
- 利用高分辨率多光谱无人机影像和机器学习对胡桃树的水分应激进行映射
通过使用无人机飞行的高分辨率多光谱遥感图像和天气数据,结合随机森林(RF)模型的机器学习方法来绘制茎部水势(SWP),根据同时进行的样本核桃树的地面测量,有效估计核桃树 SWP 水分,该方法还通过结合热数据、NDVI、红边指数和天气数据进行 - 二叉决策树和随机森林中的条件偏差及其消除
本文通过调查决策树和随机森林分类与回归中的条件操作符选择的偏差,针对具有格特征的特征的存在,提出了消除这种偏差的技术,并证明了偏差可能导致 AUC 和 r² 得分的显著差异。此外,通过提出的技术与最坏情况相比,在 AUC 和 r² 得分方面