- MM使用动态集成选择的不均衡数据流分类
提出了一种用于流数据分类的新框架,通过对非平稳漂移不平衡数据流进行数据预处理和动态集成选择技术的分类框架,以解决现代流数据分类面临的概念漂移和类不平衡数据的问题。实验结果表明,数据预处理结合动态集成选择技术在处理不平衡数据流时具有更高的准确 - AutoML-GPT:AutoML 的大型语言模型
AutoML-GPT 框架结合了多种工具和库,通过对话界面,用户可以指定需求和约束条件,实现数据预处理、特征工程和模型选择等操作,从而显著减少机器学习任务所需的时间和工作量。它能充分利用大型语言模型中的知识,为模型训练过程中的常见挑战提供宝 - 大型语言模型作为数据预处理器
此研究拓展了大型语言模型(LLMs)的应用,探索了它们在数据预处理中的潜力,包括错误检测、数据插补、模式匹配和实体匹配任务。我们提出了一个基于 LLMs 的框架,用于改进模型的性能和效率。实验结果表明 LLMs 在数据预处理中具有巨大潜力。
- 关于校准的基准研究
深度神经网络在各种机器学习任务中的应用越来越多,但随着这些模型复杂性的增加,尽管预测准确性得到了提高,但它们通常面临校准问题。我们的研究利用神经架构搜索(NAS)搜索空间,为深入探索校准特性提供了一个详尽的模型架构空间,并特别创建一个模型校 - DiffPrep: 可微分的表格数据预处理流水线搜索
我们提出了一种名为 DiffPrep 的方法,它可以自动且高效地搜索适用于给定表格数据集和可微分机器学习模型的数据预处理流水线,以使机器学习模型的性能达到最大化。我们将数据预处理流水线搜索问题形式化为一个双层优化问题,并通过将离散、非可微分 - 设计地观测图像语义分割神经网络时需考虑的技术因素综述
综述论文提供了设计用于地球观测影像语义分割的神经网络所涉及的技术因素的全面评述,包括卷积神经网络、递归神经网络、生成对抗网络和变换器模型等相关设计模式,以及数据预处理技术,为研究人员和实践者提供了全面和最新的设计有效的神经网络用于地球观测影 - 航空安全风险分析与飞行技术评估问题
这篇研究论文强调了飞行安全在中国民航业的重要性,并强调了全面研究的必要性。研究主要集中在分析超限事件和统计评估非超限数据两个方面。当前方法的挑战在于对超限事件不足的原因分析。提出的解决方案涉及数据预处理、可靠性评估、用神经网络量化飞行控制、 - 深度学习在深部脑刺激手术中的脉冲检测
采用深度学习方法,使用卷积神经网络对深脑刺激神经外科手术期间记录到的神经元活动进行分析,实现了能够不经过数据预处理而进行分类的方法。
- 通过聚合决策树模型与提升模型进行的车辆价格预测
预测二手车价格是一个有趣且有需求的问题,本研究使用数据预处理和决策树模型等方法,进行二手车价格预测并取得了令人满意的结果。
- 无敌傍门防御
我们提出了一个有效的防御框架,该框架在数据预处理过程中注入非对抗性后门,以抵御深度神经网络面对后门攻击的威胁。在多个基准测试和代表性攻击的广泛实验中,我们的方法实现了业界领先的防御效果,在干净数据上性能下降极低。鉴于我们的框架展示的惊人防御 - 利用社交媒体判决文件进行犯罪类型分类
本文提出了一种新的基于 NLP 处理的训练模型,其中包括犯罪事实数据预处理模块(CFDPM)和使用改进的 Bert 模型的分类器,通过平衡数据集分布缺陷和生成新样本来解决犯罪类型分类中数据不均匀分布的问题,并在公共基准测试上取得了最新的最佳 - 一种用于风力发电机加热故障检测的混合特征选择和构建方法
本研究提出了一种基于特征选择和构造的方法,用于检测风力涡轮机的发电机发热故障,旨在提高分类准确度和减小计算负担。
- 深度神经网络的高效端到端训练中理解数据预处理
本篇论文主要关注于了解公共云中深度神经网络(DNN)训练的数据预处理流程。我们运行实验来测试使用原始数据或记录文件两种主要数据预处理方法所带来的性能影响。初步结果表明,即使使用 NVIDIA DALI 这种高度优化的数据预处理库,数据预处理 - FARE: 可证明公平的表示学习
本研究提出一种新的公平性表示学习(FRL)方法 —— 受限编码公平性(FARE)方法,通过限制编码器的表示空间来获得适当的公平性保证,实现了经验准确度 - 公平性权衡,并且利用实用的统计程序计算了下游分类器不公平性的高置信度上界。
- 自动预测:匈牙利水痘病例估计的时间序列预测模型评估
本文利用时间序列预测技术对匈牙利的水痘病例进行模拟预测,演示 LSTM 模型在县级预测方面的表现优于其他模型,SARIMAX 模型在国家级预测方面的表现最佳。同时,我们的数据预处理方法的表现也优于传统的数据预处理方法。
- 基于流行度的数据集成
iTelos methodology aims to minimize data preprocessing costs and increase backward compatibility and future sharing by t - pyKT: 用于基于深度学习的知识追踪模型基准测试的 Python 库
本研究基于 Python 平台开发了一个名为 pyKT 的标准化基准测试平台,旨在通过对多种 DLKT 模型的透明实验和系统评估来探究深度学习的知识追踪问题,并提出了一些实用意见和建议。
- PROMISSING: 剪枝神经网络中的缺失值
该研究提出了一种名为 PROMISSING 的神经网络学习和推断过程中对缺失值进行修剪的方法,无需移除或填补缺失值,而是将其作为一种新的信息源,实现类似于各种填补技术的预测效果,并提高模型对于缺失信息的处理能力。
- 推荐的监督对比学习
这篇论文提出一种名为 SCL 的学习范式,支持图卷积神经网络,同时加入了数据预处理过程中节点之间的相似度计算和节点复制的数据增强方法,经实验证明可以提高推荐准确度和抗干扰能力。
- AAAI基于情感状态构建鲁棒性特征的多模式视频欺诈检测新型投票方案
本文介绍了一种基于多模态特征和情感状态的新的欺诈检测方法,该方法通过数据预处理、音频模式特征提取和投票方案等步骤,显著提高了多模态欺诈检测准确性,并实现了情感状态转换的新功能。