- 有偏的二元属性分类器忽略了大多数类别
本研究延伸了梯度基于 Class Activation Mapping (CAM) 方法,以适用于二分类器,并可视化二元面部属性分类器的活跃区域。实验结果表明,偏斜分类器主要依赖于多数类别的偏倚激活,而均衡分类器在不平衡数据上经过调整后,多 - VOROS:将 ROC 曲线提升到 3D
用 ROC 曲线下面积作为评估方法在不平衡的情况下容易忽略分类器性能的差异,本研究提出一种基于成本的三维 ROC 曲线来更好地评估不同分类器的性能差异。通过引入 VOROS 作为 ROC 曲线的三维泛化,可以更准确地捕捉到分类器的成本差异。
- 警告标签不发两次:预算有限时,数量胜过质量的二元分类器比较
我们研究了如何在给定一个模糊标签的预算的情况下,比较两个二元分类器的准确性。我们证明了一个与常规智慧相悖的定理,即如果目标是确定两个分类器中的更好者,则在更多样本上收集单个标签是最好的。我们的结果是基于 Cramér 定理的非平凡应用得出的 - 关于事实问答中幻觉的早期检测
我们通过探究模型生成的输入、输出和内部状态中的指标来检测大型语言模型生成中的幻觉,结果表明这些指标在幻觉生成和非幻觉生成之间存在差异,我们进一步通过训练二分类器使用这些指标作为输入特征来将模型生成划分为幻觉和非幻觉,此二分类器的 AUROC - 超越近视:通过整体预测趋势从正面和未标记数据中学习
通过重新采样正数据以确保正例和未标记样本之间的平衡分布,基于时间点过程(TPP)的趋势检测来处理正和未标记数据(PUL)问题。
- 基于铰链损失训练的深度学习二元分类器的基本限制
通过暴露使用铰链损失训练的基于深度修正线性单元(ReLU)前馈神经网络(FNN)或深度 ReLU 和 Tanh 激活的 FNN 的二元分类器的基本测试性能限制,本文导出了它们各自的新颖渐近测试性能限制,并通过大量的计算机实验验证了这些导出的 - 分析数据不纯度对精神障碍检测性能的影响
通过去除数据杂质来提高主要抑郁症和创伤后应激障碍检测性能的研究
- 利用自然语言处理技术进行点击诱饵分类和内容剧透识别
该研究提出两个二分类器和两种方法,用于分类和揭露标题党,并为第二个任务创建了模型,其中利用问题回答模型来确定标题党的起始和结束位置。
- 利用一对一深度学习策略和联合概率估计进行多类别分类
本文提出了一种新的 One-versus-One(OvO)多分类模型,该模型结合了联合概率测量,通过解决联合概率距离最小化问题来估计主体的类概率,从而在不同应用中实现了比其他现有技术更高的分类准确性。
- AAAI优化 AUC 是否划算?
通过提出一种高效的算法 AUC-opt 来寻找证明最优 AUC 的线性分类器,并且证明问题在一定条件下是 NP 完全的;此算法在实验中证明相较于其他方法有所改善,但在大多数测试数据中表现并不如标准分类器。
- EMNLP自适应负样本的开放世界分类
提出基于自适应负样本 (ANS) 的方法,设计可在训练阶段生成有效的合成开放类别样本,并在不需要任何先前知识或外部数据集的情况下使用。采用辅助的一对其余二元分类器,通过利用生成的负样本避免了复杂的阈值寻找阶段。在三个基准数据集上进行的大量实 - CVPRDist-PU:基于标签分布视角的正 - 无标记学习
本文提出了一种用于 Positive-Unlabeled 学习的标签分布一致性方法,通过对齐无标签数据和基础事实标签分布的期望值,实现了一定程度的学习监督,并进一步采用信息熵最小化和 Mixup 正则化来避免无标签数据上标签分布相同的平凡解 - ICLR回归网络的标签编码
提出使用 binary-encoded labels 来进行回归问题,该方法可以通过利用二进制分类算法来提高准确性并具有误差校正功能,与其它专门化方法和直接回归方法相比较,有更低的误差
- CVPR隐式身份泄露:限制提高 Deepfake 检测泛化性的绊脚石
本文研究在深度伪造检测任务中二元分类器的泛化能力,发现其泛化能力的障碍是由于图像中非预期的身份表示引起的隐式身份泄漏现象,并提出了 ID-unaware Deepfake Detection Model 方法来减少此现象的影响,实验结果表明 - 面向老年痴呆患者的人工智能语言评估工具
本文提出了一种使用人工智能的语言评估工具,利用机器学习中的二元分类器来识别老年人患痴呆所引起的语言障碍,评估了不同任务、特征与媒介对分类器性能的影响,并确定了工具的可靠性和有效性。
- 基于人工和匿名训练的多分类器故障预测模型,确保数据隐私
本文提出了一种新颖的非侵入式系统故障预测技术,该技术利用开发人员提供的信息和原始日志中的最小信息(而不是挖掘整个日志),并将数 据完全保留在数据所有者的管辖范围内。
- ICCV低样本验证:主动重要性抽样用于估计稀少类别的分类器性能
我们提出了一种统计验证算法,用于准确估计二元分类器的 F 得分,特别适用于罕见类别,并且证明该算法可以使用较少的标签进行验证。
- 学习开放世界物体提议,不需学习分类
本文提出一种基于 Object Localization Network (OLN) 且不需要分类器的目标定位方法,创新性地实现了目标定位的普适性并在交叉数据集上验证了其有效性。
- ICML利用替代集分类从多个无标签数据集进行二元分类
本文提出了一种从多个未标记数据集中训练二分类器的方法,通过将每个观察数据归到各自对应的数据集来实现替代数据分类,最终结果在分类一致性方面优于当前最先进的方法。
- 基于零样本离群生成和分层特征提取的异常检测
本文提出了一种可以通过生成异常样本来解决少数异常样本数据不均衡的方法,利用自编码器和变分自编码器的双层分层潜空间表示来将合法数据的特征描述符深度提取为更强的表示,再利用这些生成器合成未见过的负样本,训练二元分类器以获得鲁棒的且无需实际异常样