基于 Transformer 的澳大利亚建筑供应链风险管理中的命名实体识别

Nov, 2023

基于 Transformer 的澳大利亚建筑供应链风险管理中的命名实体识别

Transformer-based Named Entity Recognition in Construction Supply Chain Risk Management in Australia

Milad Baghalzadeh Shishehgarkhaneh, Robert C. Moehler, Yihai Fang, Amer A. Hijazi, Hamed Aboutorab

TL;DR利用命名实体识别 (NER) 结合变压器模型，本研究从新闻文章中提取风险相关的实体和见解，并突出了自然语言处理驱动的解决方案在地理媒体特定情境下革新建筑供应链风险管理 (SCRM) 的潜力。

Abstract

The construction industry in Australia is characterized by its intricate supply chains and vulnerability to myriad risks. As such, effective supply chain risk management (SCRM) becomes imperative. This paper employs different →

construction industry supply chain risk management transformer models named entity recognition nlp-driven solutions

发现论文，激发创造

科学命名实体识别的分层 Transformer 模型

使用 BERT 和 transformer 层的简单和有效的 Named Entity Recognition 方法在计算机科学和生物医学领域的三个基准数据集上优于当前最先进技术，无需外部资源或特定数据增强。

Mar, 2022

基于 Transformer 的法语命名实体识别：通过对相似领域语料库的对抗性适应实现

本研究提出一种基于 Transformer 和对抗适应的 NER 方法，用于针对资料较少的语言如法语中的实体识别问题。实验结果表明，该方法在三个标注数据集上的表现优于相应的未适应模型。

Dec, 2022

使用表格语言模型在工业表格中进行命名实体识别

本文研究如何将基于 transformer 的模型应用于工业级别的表格数据中的实体识别问题，并开发了一种专用的表格数据增强策略来提高性能，实验证明表格的归纳偏差对于 transformer-based 模型的收敛至关重要。

Sep, 2022

具有关系关注和类型关注的多任务 Transformer 用于命名实体识别

本文提出一种多任务 Transformer 模型，该模型将实体边界检测任务整合到命名实体识别任务中，通过关系分类来实现实体边界检测，并采用外部知识库和自注意力及交叉注意力机制来提高解码时实体类型映射的准确性。在多个实验数据集上的实验结果表明，该方法显著提高了生成型 NER 模型的性能。

Mar, 2023

基于 Transformer 的命名实体识别与数据表示的结合

该研究通过研究基于 Transformer 的模型及其在命名实体识别任务中的有效性，探讨了数据表示策略，包括单句、多句和上下文，并分析了使用单一策略训练模型可能导致在不同数据表示上表现不佳的问题。为了解决这个局限性，该研究提出了一种结合训练过程，利用这三种策略来提高模型的稳定性和适应性。该方法的结果在四种语言（英语、波兰语、捷克语和德语）以及各种数据集上进行了展示和讨论，证明了这种结合策略的有效性。

Jun, 2024

电子病历中基于 Transformers 的方法应用：一项系统文献综述

该文是关于基于 Transformer 的自然语言处理（NLP）应用到电子病历（EMR）领域的最新研究进展的系统文献综述，涵盖了业务问题、NLP 任务、模型和技术、数据集可用性、建模再现性、语言和交换格式等方面。通过分析当前研究的局限性和未来研究建议，该文提供了有关该领域 Transformer-based 方法的综合评估。

Apr, 2023

使用合成数据进行语音转文本中地址提取的命名实体识别

本文介绍了一种建立在双向编码器变换器（BERT）架构上的命名实体识别（NER）模型的方法，具体使用了 SlovakBERT 模型。该 NER 模型从语音转文本转录获取的数据中提取地址部分。由于真实数据的稀缺性，使用 GPT API 生成了一个合成数据集。强调了在这种人工数据中模仿口语变异的重要性。我们的 NER 模型仅使用合成数据进行训练，并使用小型真实测试数据集进行评估。

Feb, 2024

利用多语言 Transformer 使用伪标签增强多语言和代码混合的复杂命名实体识别 —— 在 SemEval-2022 任务 11 中的 UM6P-CS 模型

使用多语言 Transformer XLM-RoBERTa 的上下文化表示来处理多语言和混合编码查询的复杂 NER 任务，通过 CRF 的标记分类层和拾取来捕获命名实体范围和使用自我培训机制从大型未标记数据集生成弱标注数据。在 Multilingual Complex Named Entity Recognition 的共享任务中，我们的提出的系统在多语言和混合编码 MultiCoNER 的追踪中分别排名第 6 和第 8。

Apr, 2022

LMN 在 SemEval-2022 任务 11 中：基于 Transformer 的英文命名实体识别系统

本文介绍了我们参加 SemEval-2022 多语言复杂命名实体识别英文赛道的基于 Transformer 预训练模型的简单有效基准系统，取得了 72.50% 的 F1 得分，同时讨论了通过实体链接进行数据增强的方法。

Feb, 2022

UMLS-KGI-BERT: 基于数据中心的转换器中的生物医学实体识别知识集成

通过从 UMLS 中提取文本序列，该工作为丰富生物医学变压器编码器的语言表示做出了数据为中心的范例贡献，从而将基于图的学习目标与掩码语言预训练相结合，初步实验结果表明该框架提高了多个生物医学和临床命名实体识别任务的下游性能。

Jul, 2023