- 探索如暴风雨,利用如雨滴:关于利用坐标下降优化器对内核调度器进行精调的益处
通过将 AutoTVM 算法 Droplet Search 整合到 Ansor 的探索阶段中,我们展示了在减少搜索时间的同时提高内核质量的潜力。应用该方法于 Ansor 生成的前 300 个内核时,通常比允许 Ansor 分析 10,000 - 学习系统中竞争对手之间的无耐受合作
研究协同学习系统,在此系统中,参与者是竞争对手,如果通过合作而损失收入,他们将背叛系统。我们首先研究了完全协作方案,发现这导致市场崩溃,两家公司的收入都降为零。接着,我们展示了一种单方面协作方案,即只有质量较低的公司分享模型,这提高了两家公 - 城市空气污染预测:利用卫星观测和气象预报的机器学习方法
利用 Sentinel-5P 卫星、气象条件和拓扑特征的数据,本研究引入了一系列机器学习模型来预测未来 5 种主要污染物的水平。通过在米兰都市区进行的实验,这些模型在预测未来一天的污染物水平方面表现出了良好的效果,误差率约为 30%。该研究 - 基于模型的针对表数据的考虑特征空间属性的反事实解释
该研究提出了一种使用标准化流的高效反事实解释方法,该方法捕捉复杂数据分布,学习具有保持接近性的有意义的潜在空间,并改进预测,特别在处理分类变量时表现出色。
- 使用 CNN-LSTM 简洁建模进行水流预测
在这项研究中,我们将 CNN-LSTMs 的应用扩展到时间序列设置中,利用滞后的水流数据与降水和温度数据相结合,预测水流状况,并在内布拉斯加州的 32 个 HUC8 流域中的 21 个流域中取得了显著的预测性能改进,展示了 Kling-Gu - WannaLaugh: 身份可配置的勒索软件模拟器 -- 学习模仿恶意存储操作
该研究论文介绍了一种新型的勒索软件模拟器,用于研究勒索软件的行为特征,并展示了如何使用此模拟器来训练有效的机器学习模型,以检测勒索软件,并在机器学习驱动的网络安全中取得了显著进展。
- 学习字距 —— 集合估计最优字间距
通过提出两个机器学习模型 —— 具体是 pairwise 模型和 set-wise 模型,本文解决了字距调整的困难,通过对给定字形图像进行估算,实现了一致性更高的字距调整。
- 潜在表示的多元宇宙映射
通过多元分析解决机器学习中的可靠性和鲁棒性问题,我们提出了 PRESTO,一个有原则的框架,用于映射依赖于潜在表示的机器学习模型的多元宇宙。我们的框架使用持久同调来表征不同组合的多样化机器学习方法,(超) 参数配置和数据集所产生的潜在空间, - 课程讨论论坛中的 Bloom 认知和情感分析层次分类
本研究旨在比较适用的机器学习模型,根据教育讨论区中的文本评论来评估情感和布鲁姆的认识论层级。采用了 Bloom-Epistemic 和情感分析的分层方法,并成功开发出一个基于文本评论的课程学习子系统,按照情感和认识论分析的类别评估意见。
- ACPO:基于 AI 的编译器驱动程序优化
ACPO 是一个提供给 LLVM 的新框架,用于通过机器学习模型进行编译器驱动的程序优化。实验证明,ACPO 在 Polybench、Coral-2、CoreMark 和 Graph-500 上相比于 LLVM 的 O3 优化,Loop U - ProtoEEGNet:一种可解释的用于检测间发性癫痫放电的方法
利用 ProtoEEGNet 模型来实现对间症期癫痫放电的准确检测和解释性分类,从而帮助医学专家有效检测间症期癫痫放电并保持透明的决策过程。
- 流动的几何形状:用多模型机器学习推进河流几何形状的预测
本研究通过使用机器学习模型,测试了传统水动力几何方程的预测性能,提出了对河流宽度和深度进行更准确估计的数据驱动方法,其中随机森林、XGBoost 和神经网络模型的表现优于传统的水动力几何方程,为河流几何特征的预测性提供了新的解决方案。
- 不确定性量化的对抗性攻击
机器学习模型容易受到对抗性示例的欺骗,对抗攻击针对的是不确定性量化技术,攻击的目标是操纵不确定性估计,实验结果表明这种攻击比诱导错误分类的攻击更有效。
- 机器学习中的逼近健身
我们提出了一种新的方法,在遗传算法中使用机器学习模型进行适应度近似估计,重点是在 Gymnasium(游戏)模拟器中的进化智能体,其中适应度计算代价很高。维护一个包括个体及其实际适应度评分的样本数据集,我们通过整个进化过程不断更新适应度近似 - 利用可穿戴设备的机器学习模型自主识别认知能力较弱的老年人
穿戴设备预测模型、认知损害、机器学习模型、预测特征、持续健康监测
- 恶意软件分类中机器学习的解密:数据集、特征提取和模型性能的深入探究
调查了影响基于机器学习的恶意软件检测和分类的关键因素,并发现静态特征优于动态特征,并且结合二者只能稍微改善静态特征的性能。不同包装方式与分类准确性之间没有关联,而在动态提取特征中缺少行为极大地惩罚了它们的性能。较大数量的待分类家族使分类变得 - 佩戴设备用于心血管生物标记监测的光电测量信号质量评估
本研究提取了 27 个统计特征,利用梯度提升(XGBoost 和 CatBoost)以及随机森林(RF)算法训练机器学习模型来评估血容量变化的 PPG 信号质量,在使用可穿戴设备进行连续监测时,考虑了运动伪影、皮肤色素沉着和血管运动等影响 - 面向现实世界的定制健壮性通用框架:基于群体的健壮性
本文旨在通过定义一种补充现有度量方式的量化指标 —— 群体韧性,更好地评估模型在特定攻击情境下的表现并提出了两种损失函数、三种新的攻击策略,证明了该指标对于区分对特定威胁模型的脆弱性有更好的效果,并提出了一种防御方法,可以将群体韧性提高 3 - 基因组解释器:一种具有 1D 平移窗口变换器的层次基因组深度神经网络
本研究利用建立新的架构模型 Genomic Interpreter 对基因组测序数据进行预测,通过整合 1D-Swin 对数据的层级依赖性进行建模,成功识别染色质可及性和基因表达的预测,揭示了基因调控的潜在语法。
- ACOPF 优化代理的主动桶式学习
本研究提出了一种基于主动学习的框架 Active Bucketized Sampling (ABS),它将输入数据分为桶形分布,利用获取函数确定下一步的采样位置,在时间限制内训练最佳的 OPF 代理模型,实验结果表明 ABS 的性能高效。