本论文探讨了科研影响力的关键控制因素并借助机器学习和 Jackknife 方法进行实证分析,结果发现文章中心因素和作者中心因素对计算机科学领域的学者未来的学术成功最具关联性。
Feb, 2022
通过分析 2015 年 BRFSS 数据,我们深入研究了糖尿病与一系列健康指标之间的复杂关系,特别关注了收入这一新添加的变量。我们的综合分析不仅考察了每个因素的孤立影响,还探究了它们之间的相互关系以及对糖尿病的集体影响。我们的研究揭示了一个明显的趋势,低收入阶层与糖尿病发病率更高有着关联。在分析了 33 个变量,包括健康因素和生活方式选择后,我们发现高血压、高胆固醇、胆固醇检查、收入和身体质量指数(BMI)等因素具有较大的意义,这表明它们在糖尿病的发病和管理中扮演着重要的角色。
Apr, 2024
通过分析美国人口普查和疾控中心的数据,我们确定了特定社会经济因素与特定和一般健康指标之间的相关程度,并发现了一些社会经济因素(如收入和教育水平)与健康总体状况之间高度相关的趋势。
Dec, 2022
本文运用多种机器学习算法对 COVID-19 患者数据库进行分析,以了解和解释患者的社会经济特征与其死亡率的关联性,并分析机器学习模型对 COVID 患者社会经济数据的全局和局部解释。
Feb, 2023
大学辍学预测使用学术、人口统计、社会经济和宏观经济数据类型,通过训练四个二元分类器来预测学生是否会毕业或辍学,结果发现学术数据类型对模型性能最有影响。
Oct, 2023
该论文提出了一个深度学习模型,用于分析 1995 年至 2014 年间 1.2 亿个贷款的起始和每月表现记录,该模型涉及贷款特定和宏观经济变量,并揭示了多重贷款风险的高度非线性性及其与失业率等变量之间的紧密联系。
Jul, 2016
使用大数据和机器学习方法来探讨多代际劳动力市场的参数,共发现 28 个参数并将其分类为 5 个宏观参数,包括学习和技能,就业部门,消费者产业,学习和就业问题以及特定于不同代际的问题,并提供了一个对多代际劳动力市场的知识结构和文献综述。此研究有助于开发自主能力和系统,并促进劳动力经济和市场的新方法,进而实现经济可持续发展。
本研究使用 Scikit-learn 中五种机器学习模型,在 924 名牙科学生的数据集上训练并比较,结果显示随机森林模型的准确率为 94.9%,效果最佳。研究建立的模型可以用于预测学生的表现和学习策略,并实施恰当的干预措施来提高学生的学习进展。
Oct, 2022
通过对马达加斯加的研究,我们发现宏观经济因素对可再生能源消费具有最大的影响力,其中国内投资、外商直接投资和通货膨胀对可再生能源的采用起到积极作用,而工业发展和贸易开放对可再生能源消费产生了负面影响。
本研究旨在探索使用机器学习和数据挖掘技术解决收入不平等问题。使用 UCI 成年人数据集进行分类,并采用 Gradient Boosting 分类器模型,最终达到了 88.16%的准确率,打破了现有工作的基准准确率。
Oct, 2018