HunFlair: 一种易于使用的工具,用于现代生物医学命名实体识别
通过在 Apache Spark 之上重新实现 Bi-LSTM-CNN-Char 深度学习架构,我们提出了一个单可训练的命名实体识别(NER)模型,该模型在七个公共生物医学基准测试中获得了新的最优结果,而不使用像 BERT 这样的重型上下文嵌入。该模型在生产级别代码库中作为开源 Spark NLP 库的一部分免费提供,并且可以扩展以支持其他人类语言,而不需要更改代码。
Nov, 2020
该论文介绍了 NeuroNER,一种基于人工神经网络的易于使用的命名实体识别工具。用户可以使用图形化的 Web 用户界面(BRAT)注释实体,从而训练 ANN,并预测新文本中实体的位置和类别。NeuroNER 使这个注释 - 训练 - 预测流程变得平滑和易于访问。
May, 2017
通过对 28 种已发布系统的调查,我们在三个公开可用的语料库上深入分析了五种不同实体类型的性能比较,发现 BTM 工具在异构数据集上的性能明显低于同质数据集中的结果,表明在野外应用中 BTM 工具的性能会下降,需要进一步的研究以增强其稳定性。
Feb, 2024
研究人员利用自动化文本挖掘技术,设计了一种针对医学研究文章关键词自动识别及网络提取的全流程解决方案,可在大规模的 PubMed 和 CORD-19 数据库上快速检索有关 COVID-19 和其他医学研究的相关实体,并生成实体列表及图表。
Apr, 2023
使用 BERT 和 transformer 层的简单和有效的 Named Entity Recognition 方法在计算机科学和生物医学领域的三个基准数据集上优于当前最先进技术,无需外部资源或特定数据增强。
Mar, 2022
本研究探索了孟加拉命名实体识别领域的现有研究状况,找出了当前技术和数据集所面临的限制,并提出通过使用新颖的 Gazetteer 和先进的自然语言处理工具来改善命名实体识别的性能。
Jan, 2024
自然语言处理(NLP)领域中,命名实体识别(NER)作为从非结构化文本中提取结构化洞见的关键机制,在本文中得到全面探索,融合了基础原理和当代人工智能的进展。该研究从 NER 的基本概念开始,涵盖了从传统的基于规则的策略到当代的转换器架构的一系列技术,特别是突出了 BERT 与 LSTM 和 CNN 等集成算法。该论文强调了针对金融、法律和医疗等复杂领域定制的领域特定 NER 模型,并强调了它们的专业适应性。此外,研究还涉及强化学习、创新构建(如 E-NER)以及光学字符识别(OCR)在增强 NER 能力方面的相互作用。论文以实际领域为基础,阐明了 NER 在金融和生物医学等领域中不可或缺的作用,并解决了它们所面临的独特挑战。结论部分概述了开放性挑战和路径,将这项工作标记为进入 NER 研究和应用的全面指南。
Sep, 2023
本文提出了一种集成多种模型的混合方法,以解决生物医学实体识别中的局限性,并在 i2b2/2010 数据集上评估,得到了 90.11 的 F1 分数。
Dec, 2023
研究比较 FLAIR 模型与其他模型(如 BERT)在生物医学命名实体识别任务中的表现,发现 FLAIR 在提供的 PubMed 向量上表现良好,甚至在某些任务上超越了 BERT,并且与其他模型叠加使用可以进一步提高结果。
Aug, 2019
BERN2 是一种用于生物医学实体识别和归一化的工具,采用多任务命名实体识别模型和神经网络归一化模型,能更快、更准确地进行推理,帮助构建生物医学知识图谱。
Jan, 2022