- 对比式任务专用句子编码器的信息类型分类
在危机情况中,用户生成的信息内容已成为重要的信息来源,然而,分类模型受到噪声和事件相关偏见的影响,这仍然是一个具有挑战性的任务,需要复杂的任务适应性。为了解决这些挑战,我们提出使用对比任务专用的句子编码器进行下游分类。我们在 CrisisL - 未知管理:开放集合识别与相关领域综述
本文综述开放集识别领域的最新文献,识别常见实践、限制和与连续学习、分布外检测、新颖性检测和不确定性估计等机器学习研究领域的联系,揭示了开放集识别领域的开放问题,并提出了几个研究方向,以促进和规范未来对更安全的人工智能方法的努力。
- 主观学习任务中众包标注者观点的捕捉
基于主观分类任务,我们提出了适用于文本的 Annotator Aware Representations (AART) 方法,旨在改善采集标注者观点性能,并学习标注者行为特征。
- 利用加速度计评估急性脑卒中后上肢运动功能
使用加速度计和机器学习来提醒医疗专业人员关注中风后最初几天内运动功能的迅速变化的效力的初步评估。
- 基于 Transformer 与卷积神经网络结合的集成方法用于检测人工生成文本
我们的研究通过将 Sci-BERT、DeBERTa 和 XLNet 等变形器模型与卷积神经网络 (CNNs) 进行集成,构建了一些分类模型,实验证明考虑的集成架构在分类方面的性能超过了单个变形器模型。此外,所提出的 SciBERT-CNN - 亚洲人脸识别任务的新基准:基于大型模型的人脸分类
本文介绍了一种新的大规模韩国影响力数据集 KoIn,该数据集包含各种环境中的韩国名人的真实照片,可用于训练分类模型并对韩国影响者进行分类。我们详细描述了我们提出的数据集,并验证了其对多种分类模型的有效性。此外,我们分析了大规模模型在该数据集 - 提升二进制代码注释质量分类:集成生成人工智能以提高准确性
通过整合生成的代码和注释对,提高二进制代码注释质量分类模型的准确性, 使用包含 9048 对用 C 语言编写的代码和注释的数据集,每个都标注为 “有用” 或 “无用”。除此之外,还使用大型语言模型架构生成代码和注释对,并标记以指示其效用。这 - 利用发散估计稳定 EEG 分类中的主体转移
我们提出了一种使用正则化技术来减少分类模型在未见过测试主题上性能下降的方法,并利用图形模型和神经网络模型来描述脑电图分类任务,并在大型基准脑电图数据集上进行了广泛的计算实验,发现我们的方法显著提高了测试主题的平衡准确性,并降低了过拟合。
- 从零到英雄:通过合成数据注入和模型查询检测泄露数据
为了保护数据的知识产权,在机器学习应用日益增多、且其成功与训练数据的质量密切相关的背景下,缺乏对未经授权的模型训练过程泄露数据的检测机制。本文针对表格数据领域,引入了一种名为局部分布偏移合成(LDSS)的新方法来检测训练分类模型所使用的泄露 - 关于基于训练的 ChatGPT 检测方法的泛化性
ChatGPT 是最流行的语言模型之一,在各种自然语言任务上表现出色。本研究的目的是全面调查这些方法在分布偏移下的泛化行为,包括提示、文本长度、主题和语言任务,从而为 ChatGPT 检测的未来方法或数据收集策略的开发提供指导。
- 训练神经网络中的变异性鲁棒非参数假设检验
基于网络输出的一个稳健假设检验框架,我们提出了一种新的分类模型之间的相似性度量方法,该方法可以适应经过训练模型的其他衍生量。
- GNN4EEG:使用图神经网络进行脑电图分类的基准和工具包
用于 EEG 信号基于图神经网络的建模的 GNN4EEG 是一个多功能且易于使用的工具包,并包括四个 EEG 分类任务的大型基准、各种先进的 GNN 基于 EEG 分类模型的易于使用的实现以及全面的实验设置和评价协议。
- 机器学习方法在自闭症谱系障碍的早期诊断中的应用
利用不同机器学习算法研究自闭症的诊断方法,发现了最重要的特征并自动化了诊断过程,同时采用流行的聚类算法对数据集进行了进一步分析,得出了最佳聚类模型。
- Circles: 高类别数量多分类问题的模型间比较
最近机器学习的进展激发了研究人员生成处理百个类别(如图像数据集)的分类模型,但是在可视化高数量类别的分类模型和分类问题中模型间比较这两个领域尚未得到足够的关注。本文介绍了我们的交互式可视分析工具 Circles,允许在一视图中对数百个带有 - KDD生物临床 BERT、BERT Base 和 CNN 预测药物评论满意度的性能比较
开发自然语言处理(NLP)模型,分析患者的药物评价并准确分类为积极、中性或消极满意度,以减轻医护人员工作量并对患者生活质量提供更深入的洞察,这是治疗效果的关键指标。研究实施和评估了几个分类模型,包括 BERT 基础模型、Bio+Clinic - 预测一个积极健康老龄化应用程序的早期退出
我们提出了一种机器学习方法来预测活跃健康老龄化应用程序的早期退出,并通过处理给定的数据库、生成七个数据集并使用预处理技术构建分类模型来预测用户的依从性,提交 11 次正式运行并展示机器学习算法能够提供高质量的依从性预测。
- 数据管理与可解释机器学习中的归因分数
使用实际因果关系来定义数据库中查询答案和机器学习中分类模型的解释性分数,其中包括与数据库修复的有用联系和利用,以及对分类模型中责任分数的扩展和分析。
- 评估 GAN 生成的合成表格数据在类别平衡和低资源环境下的实用性
本研究旨在解决分类任务中不平衡数据的问题,并评估 SMOTE、ADASYN 和 GAN 技术在生成合成数据以解决类别不平衡和提高分类模型在低资源环境下的性能方面的适用性。
- 分类器解构: 针对文本分类模型的数据重构攻击
本文提出了一种名为 Mix And Match 的新型有针对性数据重构攻击,强调了考虑分类模型中的数据重构攻击与隐私风险的重要性,并提供了有关可能泄漏的见解。
- 基于连续学习的新颖感知情感识别系统
本文提出了一种基于连续学习的方法来应对自动情感识别任务中的新颖性。