- 非接触式多导睡眠图:无线电波告诉我们有关睡眠的信息
通过分析无需贴身传感器的人体反射射频波,开发了先进的机器学习算法来监测睡眠和夜间呼吸,验证结果表明该模型捕捉了睡眠的不同阶段、检测到了睡眠窒息,并可以测量患者的睡眠呼吸暂停指数,同时发现了睡眠阶段与多种疾病的相关关系。
- 函数树:透明机器学习
一种表示多元函数的树状方法,揭示了函数的全局内部结构和各个自变量子集之间的相互影响,通过图形化可视化快速识别和计算多元函数的主要和相互作用效应。
- 学习差分私有而准确的规则列表的平滑灵敏度
通过建立基尼不纯度的平滑敏感性并利用其提出差分隐私贪婪规则列表算法,实验结果证明,整合平滑敏感性的差分隐私规则列表模型比基于全局敏感性的其他差分隐私框架具有更高的准确性。
- 提高嘈杂数据集上主动学习的成本效益
主要介绍了主动学习策略在解决二分类问题中的应用,提出了一种基于偏移正态分布采样函数的方法,通过限制噪声和正类标签选择,提高了 20% 到 32% 的成本效率。
- 使用嵌入翻译进行模型配对,检测开放集分类任务中的后门攻击
我们提出了一种使用模型对开放集分类任务的技术来检测后门攻击,该技术可以在不同体系结构、独立训练且使用不同数据集的模型中检测到后门攻击,并通过线性操作比较嵌入向量并计算相似度得分。
- KDD通过拓扑自然语言分析揭示客户问题
电子商务公司关注顾客服务请求,提出了一种新型的机器学习算法,利用自然语言技术和拓扑数据分析监控顾客问题的新兴和趋势,验证结果与新闻来源高度一致。
- 基于高斯过程回归的复共振谱异常点定位方法
基于高斯过程回归的机器学习算法有效地定位共振系统中的例外点,并将其应用于铜氧化物中激子共振谱的本地化,为该系统中例外点的实验观察提供了精确计算基础。
- 人口和就业特征对卡车流量的影响分析:基于 NextGen NHTS 出发地 - 目的地数据
卡车运输由于灵活性和更快的交货速度等优点,仍然是美国货物运输的主要方式。了解人口和就业特征对卡车流量的影响对于更好的交通规划和投资决策至关重要。本研究使用美国人口普查局的人口和就业数据,利用机器学习算法(XGBoost)建立了一个模型来预测 - 通过路径发展网络优化心房颤动患者的药物决策
通过使用 12 导联心电图数据,本研究引入了一种机器学习算法,用于预测是否应该向房颤患者推荐使用抗凝治疗。该算法利用 STOME 增强时间序列数据,并通过卷积神经网络进行处理。通过引入一种路径发展层,该模型在阴性预测率为 1 的条件下实现了 - 利用微地震测量和机器学习方法重建海浪数据
利用微震测量站和机器学习算法,本研究提出一种新的海浪监测系统,用以重建海浪浮标数据并提高可靠性。实验结果表明该系统能够克服浮标可靠性问题并保持同样的准确性。
- 基于机器学习算法的低碳节能旅游数据特征分析与挖掘
通过机器学习算法对低碳出行数据进行特征分析和挖掘,本研究旨在研究居民低碳意识形成机制,为交通管理者引导城市居民选择低碳出行方式提供重要依据。实验结果表明,居民低碳出行意愿可分为三类:强烈、中立和不强烈;而职业、居住地、家庭结构和通勤时间是最 - 预测不确定性的模型无关变量重要性:一种基于熵的方法
这篇论文介绍了如何将解释性方法扩展到具有不确定性意识的模型中,并演示了如何通过这些方法深入理解模型行为、特征对预测分布熵和真实标签对数似然的影响,以及不确定性来源对模型性能的影响。
- 预测事故严重程度:使用随机森林模型分析影响事故严重程度的因素
这项研究调查了使用随机森林机器学习算法预测事故严重程度的有效性,在大型都市地区的事故记录数据集上训练模型并使用各种指标进行评估,结果显示随机森林模型能够有效地预测事故严重程度,准确率超过 80%,并确定了模型中最重要的变量,包括风速、气压、 - 机器学习算法综合领域知识用于真菌孢子浓度预测
这篇研究论文介绍了一种利用时间序列数据和领域知识的机器学习算法,以预测真菌孢子浓度,从而实现纸浆和造纸行业的实时质量控制。
- 用基于聚类的自助法学习电力需求的区间预测
通过使用残差自举算法进行区间估计,本研究介绍了一种用于获取电力需求的未来估计值的算法。该算法使用机器学习算法获取训练集上的点估计值和对应的残差,并通过无监督学习算法将残差进行分组和分区,以获取最接近测试日的相似日的残差进行自举操作。该算法使 - 利用知识图谱预测药物间相互作用
该论文介绍了一种名为 medicX 的端到端框架,它将来自公共药物库的多种药物特征集成到一个知识图谱中,并使用各种翻译、分解和神经网络方法嵌入图谱中的节点,最终使用机器学习算法来预测未知的药物相互作用。
- 多层建筑中基于数据驱动的预测决策点选择的方法研究
应用机器学习算法研究复杂室内建筑中行人路径选择行为的潜力探索。
- 可解释的等变神经网络用于粒子物理学:PELICAN
PELICAN 是一种新颖的置换等变和洛伦兹不变或协变的拼接网络,它在分类和回归洛伦兹增强顶夸克的上下文中,特别是在识别和测量密集环境中 $W$ 玻色子的困难任务中,相比其他方法表现出更少的复杂性、更高的可解释性和原始性能。
- 基于项目反应理论的算法综合评估
在本文中,我们提出了一个基于修改过的 IRT 模型的框架,用于评估算法组合在数据集存储库中的性能,同时揭示算法性能的重要方面,例如一致性和异常性。我们测试了这个框架在广泛应用的算法组合上,展示了这种方法作为一种具有洞察力的算法评估工具的广泛 - 使用区块链和机器学习预测心脏疾病
本文介绍了如何利用区块链技术和机器学习算法来改善心脏病预测的准确性和患者数据的安全性,以及对于缺乏医疗卫生基础设施而言,如何对血压、胆固醇、体重和吸烟等关键因素进行监测和干预以提高治疗效果。