- 利用反事实图像强化预训练模型
该论文提出了一种新的框架,通过语言引导生成对抗图片来加强分类模型。通过使用对抗图片数据集来测试模型的弱点,并将对抗图片作为增加的数据集来微调和加固分类模型,研究揭示了使用小规模对抗图片进行微调可以有效增强模型的性能。
- 评估模型在附近的普遍性
该论文评估了分类模型在无需依赖于标签的情况下对于分布外测试集的泛化能力,并提出了一种名为 vicinal risk proxy (VRP) 的方法来计算模型的准确性,该方法通过综合考虑邻近样本的响应来评估每个样本的正确性,从而在方法学和实验 - 基于 RNN、随机森林和 XGBoost 的分类建模用于非平衡数据:东盟 5 国股市早期崩盘检测案例
该研究通过使用简单的 RNN 等多种循环神经网络(RNN)结构与经典算法进行比较,评估其在构建 ASEAN-5 股票市场中用于早期崩盘检测的分类模型方面的性能。研究使用不平衡数据进行分析,该类数据很常见,因为市场崩盘的发生是罕见的。研究分析 - 使用 CNN、k-nearest 邻居和支持向量机检测 5G 窄带干扰器
在基于机器学习的在线观测系统中,利用预训练的机器学习模型在物理层检测 5G 蜂窝网络中特定控制子通道的窄带干扰攻击,研究了卷积神经网络与支持向量机和 k 最近邻方法相结合使用主成分分析的性能差异。
- 探索边界和强度:揭示社交媒体言论的复杂范围
使用 8,258 条推特进行标注,该研究创建了一个广泛的 Amharic 基准数据集,用于三个任务:分类、识别仇恨目标和评估冒犯和仇恨的强度。结果显示,仇恨和冒犯性言论无法用简单的二元分类解决,并且在连续数值范围内变量化。Afro-XLMR - 在公平表示和准确性之间填补差距
通过分析文档和句子的自然语言表示(即编码),我们发现并研究了这些编码中可能存在的针对不同子群体的偏见,并提出了缓解这种偏见的方法同时保持分类模型的较高准确性。
- 基于选择性注意力调控的持续学习
本文介绍了一种生物可行的选择性注意力驱动的调制方法,用于增强连续学习环境中的分类模型;通过使用辅助显著性预测特征作为调制信号来驱动和稳定学习非独立同分布分类任务序列,并证实该方法可以有效地提高当下最先进的连续学习方法的性能(在某些情况下高达 - FakeWatch: 一个检测假新闻以确保可信选举的框架
为了解决当今科技驱动的世界中虚假新闻(尤其是在选举等关键事件期间)的快速传播给信息的完整性带来的日益威胁,我们引入了 FakeWatch,一个全面的框架,旨在有效检测虚假新闻。通过利用一个新的精选北美选举相关新闻文章的数据集,我们构建了强大 - 通过情感分析了解人们对人行道送货机器人的社会感知、互动和安全方面
通过对 YouTube 视频评论进行的情感分析研究,本文构建了多个文本情感分类模型,并在二分类和三分类任务中评估了模型的性能。研究结果表明,在情感分析的二分类任务中,使用词频 - 逆文档频率和 N-gram 的支持向量机模型获得最高的准确率 - 通过强化学习提高特征选择的分类性能
本研究通过采用强化学习算法(特别是 Q 学习和 SARSA 学习)来解决特征选择的挑战,评估其在优化分类任务中的效果,并以乳腺癌科英布拉数据集(BCCDS)和三种归一化方法(最小 - 最大、l1 和 l2)作为实验验证。结果显示,QL@最小 - 恶意软件检测中机器学习对 Mal-API-2019 数据集的综合评估
本研究使用机器学习技术对恶意软件检测进行了全面研究,重点评估了在 Mal-API-2019 数据集上使用各种分类模型的效果,旨在通过更有效地识别和减轻威胁来提升网络安全能力。研究探讨了集成和非集成的机器学习方法,例如随机森林、XGBoost - ICLR通过目标编码和分类损失实现的神经场分类器
神经场分类器 (NFC) 是一种新颖的神经场方法,将神经场方法转化为分类任务而不是回归任务,并通过使用目标编码模块和优化分类损失来实现,从机器学习的角度回答了神经场方法的回归模型是否比分类模型更好的问题。NFC 在几乎不增加计算成本的情况下 - 利用 Transformer 和 RNN 在哺乳动物蛋白质中预测 O-GlcNA 修饰位点,使用新的损失函数训练
通过使用转化器编码器和加权的分布式 MCC 损失函数,改进了 RNN 模型在 O-GlcNAcylation 位点预测中的性能。使用这种新的损失函数,训练的双细胞 RNN 在大型数据集上取得了 38.82% 的 F1 分数和 38.21% - 基于概率单纯形上的统计建模实现的精确保持校准
基于深度神经网络 (DNNs) 的分类模型必须进行校准来评估预测的可靠性。我们提出了一种使用概率模型对概率单纯形进行校准的方法,该方法可以保留预训练模型的准确性,并在准确性保持校准任务中胜过先前的方法。
- 均衡数据,不均衡光谱:揭示类别差异的光谱不平衡
我们研究了不同类别之间的性能差异问题,并引入了光谱不平衡的概念来研究特征之间的类别偏差,通过构建一个理论框架,并在 11 个先进的预训练编码器上进行验证,我们展示了如何利用光谱不平衡来比较编码器的质量,评估和结合数据增强策略以缓解这个问题。
- 基于注意力机制的循环神经网络用于自动行为识别蛋鸡
通过声音分析识别下蛋鸡叫声类型,建立了基于循环神经网络的多标签分类模型,结合时间和频域特征,有效监测下蛋鸡行为,取得了较高的 F1 得分(F1=92.75)。
- 无需标签:在协变量漂移下估算部署后模型性能的方法
我们提出了一种鲁棒准确的性能估计方法,用于评估无标签数据上机器学习分类模型的性能,准确量化协变量偏移对模型性能的影响,并在 600 个数据集 - 模型对上进行了评估,结果表明,该方法是估计分类模型在任何评估环境中性能的最佳方法。
- 从物理数据学习有效的良好变量
通过回归模型和分类模型,我们提出并测试了两种机器学习方法来发现可能的原始变量组合,应用于描述传热现象和普遍引力定律。
- 对比式任务专用句子编码器的信息类型分类
在危机情况中,用户生成的信息内容已成为重要的信息来源,然而,分类模型受到噪声和事件相关偏见的影响,这仍然是一个具有挑战性的任务,需要复杂的任务适应性。为了解决这些挑战,我们提出使用对比任务专用的句子编码器进行下游分类。我们在 CrisisL - 未知管理:开放集合识别与相关领域综述
本文综述开放集识别领域的最新文献,识别常见实践、限制和与连续学习、分布外检测、新颖性检测和不确定性估计等机器学习研究领域的联系,揭示了开放集识别领域的开放问题,并提出了几个研究方向,以促进和规范未来对更安全的人工智能方法的努力。