- 复合分位数回归与使用新的反正切损失的 XGBoost
本文探讨了 XGBoost 在复合分位数回归中的应用,提出了一种平滑逼近的 arctan pinball 损失函数,其相对较大的二阶导数使其更适合于 XGBoost 的二阶逼近优化方法,可同时预测多个分位数,更高效且减少了分位数交叉问题。
- AFEN:基于集成学习的呼吸系统疾病分类
我们提出了 AFEN(音频特征集成学习)模型,它以集成学习的方式利用卷积神经网络(CNN)和 XGBoost 进行一系列呼吸系统疾病的音频分类,使用精心选择的音频特征作为数据的显著属性,同时应用两个独立的模型分类器,然后通过软投票将两个模型 - 基于直方图的最小方差抽样的联邦 XGBoost 用于联邦表格数据
在这篇研究论文中,我们评估了一种使用 Minimal Variance Sampling (MVS) 的基于直方图的联邦 XGBoost 模型,证明了我们的模型在联邦环境中能够通过提高准确性和回归误差来改进性能,并在一组新的联邦表格数据集上 - 应用典型度量方法评估决策树处理未知车辆碰撞数据的可靠性
研究论文通过理论和实验,探讨了 ε- 代表性方法在决策树中评估数据集相似性的可靠性,发现 ε- 代表性与特征重要性排序具有显著相关性,并将结果扩展到 XGboost 在未见车辆碰撞数据中的应用。
- 基于可解释人工智能的监督式机器学习方法的预测模型用于孟加拉患者的乳腺癌分类
乳腺癌是近年来患病率迅速增加的一种导致全球死亡率居高不下的常见疾病,本研究通过使用机器学习方法,特别是 XGBoost 算法,对乳腺癌进行预测和分类,发现 XGBoost 算法在 500 名患者的数据集上取得了 97% 的精确率。
- 可解释的人工智能整合特征工程用于野火预测
通过深入研究,我们评估了各种机器学习算法在预测野火相关任务中的分类和回归任务方面的有效性。我们发现,对于不同类型或阶段的野火分类,XGBoost 模型在准确性和稳健性方面优于其他模型。与此同时,Random Forest 回归模型在预测受野 - 评估医学诊断中机器学习模型的解释能力:一种人机协同的方法
这篇论文综合研究了决策树、随机森林和 XGBoost 模型在胰腺癌数据集上的解释能力评估,并使用人机协同相关技术和医学指南作为领域知识的来源,以确定与胰腺癌治疗相关的不同特征的重要性。同时,这些特征不仅用于机器学习模型的降维,还用于使用无偏 - 探寻视觉脑网络中直接功能连接的本质
通过对 fMRI 时间序列的全面分析探索了不同类型的视觉脑网络 (VBN),其中的图形特征分类结果显示 XGBoost 对于正相关的 VBN 的平均准确率范围为 86.5% 至 91.5%,比负相关的 VBN 高 2%,这不仅体现了每种图像 - XGBoost 和 Minirocket 算法的人体活动识别比较分析
人体活动识别 (HAR) 已得到广泛研究,最近侧重于使用先进的机器学习 (ML) 和深度学习 (DL) 算法进行准确分类的实施。本研究调查了两种机器学习算法 ——eXtreme Gradient Boosting (XGBoost) 和 M - 机器学习中的动态模型切换以提高准确度
本研究通过动态模型切换的新范式,应对了机器学习中数据集不断变化的挑战,引入了一个自适应集成模型,能够根据数据集的演变智能地在 CatBoost 和 XGBoost 之间切换,以优化预测准确性。
- 基于代理模型的体育博彩交易中动态投注的 XGBoost 学习
使用 XGBoost 机器学习方法在布里斯托尔 Betting Exchange(BBE)的一项研究结果表明,XGBoost 可以学习到盈利的赌博策略,并且可以推广学习到优于训练数据中的策略。
- 评估 MIMIC-IV 数据集和基准算法的公平性:应用于 ICU 住院时间预测
使用 MIMIC-IV 数据集研究 XGBoost 二元分类模型在预测 ICU 住院时间方面的公平性和偏见,并强调该研究对 ICU 有限资源分配的重要性,通过在人口属性上检测数据集的类别不平衡,并采用数据预处理和特征提取,发现 XGBoos - Xputer:利用 NMF,XGBoost 和简化的 GUI 体验填补数据差距
Xputer 是一种新颖的插补工具,通过将 Non-negative Matrix Factorization (NMF) 与 XGBoost 的预测优势巧妙地结合,以确保数据的完整性和提取有意义的见解。
- 将基于机器学习的早期败血症检测扩展到不同人群
本研究使用公共 eICU-CRD 数据集和韩国圣玛丽医院的私人数据集,对 LightGBM 和 XGBoost 两种集成学习方法进行比较分析,发现这些方法在处理医疗数据不平衡和增强脓毒症检测方面的有效性。具体而言,LightGBM 在计算效 - 机器学习中的勒索软件检测与分类
使用 XGBoost 和随机森林算法进行勒索软件攻击的检测和分类,证明其高准确性,为增强网络安全提供了有价值的工具。
- 通过机器学习模型的比较分析改进心血管疾病预测:以心肌梗死为案例研究
心血管疾病与吸烟、血压升高和胆固醇水平的关联突出了这些危险因素的重要性。本研究使用六种不同的机器学习模型进行比较分析:Logistic 回归、支持向量机、决策树、包装法、XGBoost 和 LightGBM。结果表明,XGBoost 作为表 - 增强脑卒中预测的综合范式:XGBoost 和 xDeepFM 算法的协同作用
通过使用全面的数据集,我们提出了一种组合模型,结合了 XGBoost 和 xDeepFM 算法的强大功能,以改善现有的中风预测模型的准确性和稳健性,并通过采用 AUC 指标的严格实验验证了我们的组合模型的有效性,与该领域的其他模型的比较增加 - ZzzGPT: 提升睡眠质量的交互式 GPT 方法
本文通过引入基于大型语言模型(LLM)的两阶段框架,结合 GLOBEM 数据集和 XGBoost 等模型,研究技术在理解睡眠模式方面的作用,以提供准确的睡眠预测和可行的反馈,从而改善智能可穿戴设备在睡眠监测中用户的参与度。
- 可解释的机器学习预测糖尿病肾病模型
通过机器学习方法分析血清代谢物对糖尿病肾病(DN)的影响,预测 DN 的患病率。使用 Least absolute shrinkage and selection operator(LASSO)回归模型和 10-fold 交叉验证选择了最佳 - 智能 OMVI:使用新的数据集识别混淆恶意软件变种
网络安全已成为数字时代的一个重要问题,恶意软件分析作为网络犯罪的一项重要组成部分,而为了解决这个挑战,开发了一个名为 “混淆恶意软件数据集” 的新数据集,其中使用了模仿恶意软件创建者的策略的混淆技术,通过应用不同的传统机器学习算法并进行对比