f1-score | BriefGPT - AI 论文速递

关键词f1-score

搜索结果 - 31

使用自编码器进行白血病诊断的自动化：一项比较研究
本研究使用深度学习中的自动编码器来提取包含在患者关键参数中的有价值信息，以提高白血病诊断的准确性，通过比较传统机器学习模型，结果表明我们提出的方法在准确性和 F1 得分指标上比其他机器学习模型提升了超过 11%。
PDF6 months ago
自监督训练与监督训练在器官样本图像分割中的比较
数字显微镜中的自我监督学习对图像分割具有重要意义，采用了对预任务相似的无标签数据进行内在特征学习的方法，通过像素减少和图像模糊等增强技术，能够在相对较小和更大的数据集上优于传统的监督学习方法，得到更高的 F1 得分。
PDF8 months ago
在不可区分阈值上的精确度：一种评估分类算法的方法
当调节好算法以至于无法将被标记的猫与真实猫区分时，被标记为包含猫的随机图片实际上有多大概率含有猫？通过构建一个新的度量指标，该度量指标可以将被标记为包含猫的图片与真实含有猫的图片相区分，从而评价算法的表现。
PDF8 months ago
MM2023 年 #SMM4H 会议上比较文本预处理技术用于检测自报 COVID-19 诊断的推文
使用基于 Transformer 的多个模型对推文进行预处理，实现自动识别 COVID-19 诊断的推文，并获得高于平均值 4.1% 的 84.5% 的 F1 分数。
PDF8 months ago
行动时间：野外网络威胁情报的自动化分析
提供了一个新的大型开放基准数据集和一个名为 aCTIon 的结构化 CTI 信息提取工具。比较了 10 种先前工作中的解决方案，结果显示，在所有任务中，aCTIon 的 F1 得分相对于先前的工作有了 10 个百分点到 50 个百分点的提高
PDFa year ago
学习量化漏洞模式和匹配来定位语句级漏洞
通过学习漏洞模式，提出一种基于漏洞匹配的新方法来检测软件漏洞，该方法在 188,000 个 C/C++ 函数的数据集上取得了 F1-score 94% 的高准确度。
PDFa year ago
在线市场产品分类：一种集成方法
本研究提出了一种集成方法，通过使用不同的模型分别预测产品的类别、子类别和颜色并将结果结合，从而在预测这些特征时可以实现平均 F1 - 得分为 0.82，适用于电商公司的产品分类问题。
PDFa year ago
为反馈预测建立演讲者 - 听众交互模型
本文提出一种新颖的后发模型，模拟了英语中 Yeah 和 Uh-huh 以及德语中的对应标记的最小响应的使用，通过处理讲话者语音的声学特征，捕捉和模仿听众的后发行为，并编码演讲者 - 听众交互，提出了一种基于神经网络的声学后发分类器。通过在
PDFa year ago
基于 Transformer 和集成方法的阿拉伯语仇恨言论检测解决方案
本研究描述了我们参与 CERIST NLP Challenge 2022 的 hate speech detection 共享任务的情况，通过六种 transformer 模型和两种集成方法的组合来评估我们的实验效果。我们使用基于多数投票的
PDFa year ago
ACL仇恨言论检测的联邦方法
本文研究了针对社交媒体上产生的内容进行仇恨言论检测，在此基础上探讨采用联邦机器学习方法应对隐私问题，并且可以在 F1 得分方面获得高达 6.81% 的提高。
PDFa year ago
EMNLPTEDB 2022 委婉语检测挑战赛系统介绍
本研究探索基于 Transformers 的模型在委婉语检测中的表现，使用 TweetEval / TimeLM 预训练 RoBERTa 模型作为特征提取器前端和 KimCNN 分类器后端，最优结果为 0.816 F1-Score。我们观察
PDFa year ago
基于多个变压器的洪水相关推特帖子相关性分类
该论文主要研究社交媒体在灾难和紧急情况下作为信息来源的潜力和挑战，并提出了一种基于文本分类的框架来处理 Twitter 噪声数据，通过使用多个 transformers 模型最终达到了 F1-score 0.87 的高分数。
PDF2 years ago
EMNLPE-NER -- 一份法律文本的命名实体识别注释语料库
本研究主要介绍了一个公共的法律命名实体识别数据集 E-NER，它表明将通用英语文本数据集训练的命名实体识别模型应用于法律文本会导致重大的性能下降，与在 E-NER 数据集上训练和测试相比，F1 分数下降了 29.4％至 60.4％。
PDF2 years ago
基于 Seq2Seq 转移系统的指代消解
本文提出一种基于文本到文本 (seq2seq) 模式的指代消解系统，它使用转移系统来预测提及和链接，使用多语言 T5 作为底层语言模型，在 CoNLL-2012 数据集上获得了 83.3 的 F1-score，远高于之前的最优结果；在 Se
PDF2 years ago
使用 ParsBERT 和不平衡数据处理方法的波斯情感检测
本文旨在评估和比较两种标记好的波斯语情感数据集（EmoPars 和 ArmanEmo）的性能，并通过使用数据增强技术、数据再平衡、类别权重和 Transformer-based Pretrained Language Models 等方法，
PDF2 years ago
PLOD：科学文档中的缩写检测数据集
本文介绍了一个大规模的缩略语检测和提取数据集 PLOD，其中包含超过 160k 个被缩略语和长格式自动注释的文本部分，并使用该数据集生成了多个基线模型用于检测缩写词和长格式。最佳模型检测缩写词的 F1 得分为 0.92，检测其相应的长格式得
PDF2 years ago
改善孟加拉语假新闻检测性能的方法：平衡处理和模型堆叠
本文介绍了多种解决不平衡数据集问题的方法，同时提出了一种能够在数据不平衡时提高性能的技术，并将其应用于 BangFakeNews 数据集，结果表明使用数据操纵技术，如 SMOTE，可以获得 93.1% 的 F1 分数，而使用非数据操纵方法，
PDF2 years ago
Geo-DefakeHop: 高性能地理假图像检测
提出了一个名为 Geo-DefakeHop 的强健假卫星图像检测方法，它基于并行子空间学习（PSL）方法，使用多个滤波器对输入图像空间进行映射，学习最具有鉴别性的通道并使用它们的软决策分数作为特征，最终实现了轻量级高性能的假卫星图像检测，模
PDF3 years ago
KDD异常检测：如何通过有偏评估协议人为地提高 F1 分数
本文展示了 F1 得分和 AVPR 很容易受到数据污染率的影响，因此不能用于比较不同数据集上的模型，建议使用其他指标（如 AUC）来评估无监督异常检测算法。
PDF3 years ago
AAAI社交媒体中的 COVID-19 虚假新闻识别
通过训练模型可以区分真假 COVID-19 相关的健康信息，并获得 98.64% 的高 F1 分数，该研究排名第二，距离第一名仅有 0.05 个百分点的微小差距。
PDF3 years ago