- 关于计算效率的多分类校准
我们提出一种多类别标签问题的校准方法,通过多项式时间和样本复杂度来高效校准预测器,以获得对二元分类问题的强有力保证。
- 自注意力的隐性偏见和快速收敛速率
通过对自注意力机制进行梯度下降的隐式偏差研究,我们在二进制分类中的固定线性解码器上训练自注意力层,证明了全局收敛并量化了关注图的稀疏化速率,同时分析了自适应步长规则对自注意力收敛速度的加速效果,从而进一步加强了自注意力的隐式偏差视角并强化了 - 通过训练一系列损失函数在类别不平衡数据上优化 ROC 曲线
通过使用一系列的损失函数进行训练,而不是单一的损失函数,我们提出了 Loss Conditional Training (LCT) 方法来解决高度不平衡的分类问题,实验结果表明该方法提高了模型性能并对超参数选择更具鲁棒性。
- 在模糊规则二元分类中应用迭代特征选择
基于模糊规则的二分类算法中,通过迭代特征选择和基于双聚类的规则挖掘,构建了一种特征选择框架,并使用自适应增强和加权平均构建了强分类器,实验结果表明该算法能取得良好的分类性能并超越同行方法。
- 基于 OSINT 的网络威胁意识评估 LLM Chatbots
本研究探讨了聊天机器人(如 ChatGPT、GPT4all、Dolly、Stanford Alpaca、Alpaca-LoRA 和 Falcon)在开源情报中识别与网络安全相关文本的能力,并评估了现有聊天机器人模型在自然语言处理任务中的能力 - WSDM缓解图异常检测中的结构分布偏移
针对图形异常检测中结构分布偏移的问题,本研究提出了一种名为图解构网络(GDN)的框架,通过限制异常特征的影响,同时从同质性中获益,来解决正常和异常节点之间的分类问题。在两个基准数据集上进行的广泛实验表明,该框架在异常检测中取得了显著的性能提 - 用于多生成器、多领域和多语言机器生成文本检测的细调大型语言模型
SemEval-2024 Task 8 引入了识别多语言和领域中大型语言模型(LLMs)生成的机器文本的挑战。本文关注于二元分类和多类分类的子任务,并通过传统机器学习和自然语言处理进行特征提取以及基于 LLMs 进行文本分类的两种方法进行解 - 使用连续多序列 MRI 评估 QCNN-LSTM 在多发性硬化症残疾预测中的有效性
在这项初步研究中,我们比较了三种 Quantum Convolutional Neural Network-Long Short-Term Memory 模型与经典神经网络架构在多发性硬化 (Multiple Sclerosis) 残疾的二 - 基于遗传算法的带有噪声标签的二元分类问题中的特征选择优化
在带有噪声标签的情况下,我们提出了一种新颖的基于遗传算法的方法,即噪声感知多目标特征选择遗传算法(NMFS-GA),用于在具有噪声标签的二分类问题中选择最优特征子集。我们在合成数据集、具有噪声特征的乳腺癌数据集以及用于痴呆转化预测的现实世界 - 使用凸凹规划训练单层形态感知器
本文介绍了一种利用纪律凸凹规划(DCCP)训练单层形态感知器的算法,K-DDCCP 算法,将 Ritter 和 Urcid 提出的现有单层形态感知器模型与 Charisopoulos 和 Maragos 的加权纪律凸凹规划(WDCCP)算法 - 基于距离引导的生成对抗网络用于解释性二元分类
通过距离引导生成对抗网络(DisGAN)控制生成样本的变化程度,改善数据不足问题和描述二元分类决策边界的限制性,所提出的方法优于传统数据增强方法,适用于可解释的二元分类,并具有扩展成多类分类的潜力。
- 随机森林预测的量子电路
使用随机森林模型的量子电路实现二元分类预测算法,旨在减少基本量子门的数量。
- 印度语言的多语言偏见检测和缓解
缺乏多元观点导致维基百科内容中的中立偏见,从而使数百万全球读者接触到潜在的不准确信息。因此,中立偏见的检测和缓解是一个关键问题。我们为此提供了两个大型数据集 mWikiBias 和 mWNC,分别涵盖 8 种语言,用于中立偏见的检测和缓解任 - 每个任务非常少的样本的元学习
在这项研究中,我们研究了元学习和多任务学习的框架,探讨了在小样本情况下,通过少量任务和样本,能否学习到有效的共享表示,并利用该表示解决二分类问题。
- ICCV利用少样本学习和相关反馈推进图像检索
通过少样本学习方法,我们提出了一种基于超网络的方案,通过在图像检索中协助用户反馈的快速调整,实现了在多个基准测试和两个附加任务上全面验证的优越性能,并在 IRRF 中超越了强基线模型,同时也在少样本开放集识别的二进制分类任务中取得了富有竞争 - 减轻二元分类中的非线性算法偏差
该论文提出使用因果建模来检测和减轻与受保护属性非线性相关的算法偏差。我们使用了 UC Irvine 机器学习库中提供的 German Credit 数据集来开发 (1) 一个被视为黑盒的预测模型和 (2) 用于偏差减轻的因果模型。我们聚焦于 - 利用不确定性估计来提高分类器性能
模型得分和不确定性对决策边界的选择有关,该研究提供了理论分析和经验证据来证明模型得分估计偏差依赖于不确定性和得分本身,通过动态规划和保序回归算法提出的方案在三个真实数据集上比传统的只使用模型得分方法,在高精确度边界下获得了 25%-40%的 - 使用反馈信号训练多阶段深层分类器
多级分类器(MSC)是工业应用中广泛使用的,在多个经过排列的顺序中顺序工作的多个分类器,每个步骤中的分类决策是部分完成的。针对两阶段二元分类过程,我们提出了一种新的训练框架,名为反馈训练。通过样本加权方法,我们训练分类器的顺序与其实际工作顺 - 通过概率密度估计重构观众扩张视角
本文介绍了在机器学习领域中,通过二元分类任务和类概率估计,对观众进行扩展的技术。通过基于广泛使用的 MNIST 数据集的模拟研究,我们的方法能够识别出扩展观众中最相关的用户,具有持续的高精确度和召回率。
- 自组织机器人网络拓扑恢复能力预测:一种基于数据驱动的容错方法
通过基于贝叶斯高斯混合模型的两条途径的数据驱动模型,我们将自组织机器人网络的拓扑 (不可) 恢复性预测问题解决为一个二元分类问题,并成功地预测了典型问题的解决方案。