直接言語翻譯中的命名實體檢測與注入

Oct, 2022

直接言語翻譯中的命名實體檢測與注入

Named Entity Detection and Injection for Direct Speech Translation

Marco Gaido, Yun Tang, Ilia Kulikov, Rongqing Huang, Hongyu Gong...

TL;DR本文探讨了如何利用在特定环境下出现的命名实体词典来提高语音转文本模型的准确性，实验证明使用 NE 词典可以有效提高命名实体的准确性，降低人名错误率达 31%。

Abstract

In a sentence, certain words are critical for its semantic. Among them, named entities (NEs) are notoriously challenging for neural models. Despite their importance, their accurate handling has been neglected in speech-to-text (S2T) translation research, and recent work has shown that

named entities neural models speech-to-text translation person names dictionaries

发现论文，激发创造

联合语音翻译和命名实体识别

本篇论文提出了多任务模型将直接语音翻译和命名实体识别相结合，并与传统串行方法进行了对比，在不降低翻译质量的情况下，在命名实体识别任务上显著提高了性能。

Oct, 2022

仅基于词嵌入的命名实体识别

本文提出了一种基于预训练词嵌入的全无监督命名实体识别模型，使用高斯隐马尔可夫模型和深度自编码高斯混合模型进行实体跨度检测和类型预测，并基于强化学习设计实例选择器，通过神经网络消除杂乱注释，实现了无需使用任何标注词典或语料库，表现出色。

Aug, 2019

神经网络名称翻译提高神经机器翻译

本文旨在通过引入字符级的 Seqence-to-Sequence 模型来提高神经机器翻译（NMT）系统的翻译效果和识别实体名词的能力，并在双语训练中借助名称实体翻译模型来提高高质量的实体名词对齐，从而使中英翻译任务的 BLEU 分数比基础 NMT 系统提高了 2.9 个百分点。

Jul, 2016

通过正确翻译命名实体来提高神经机器翻译质量

本文介绍了一种通过将名称实体作为预处理步骤进行翻译 / 音译来提高神经机器翻译质量的方法，并进行了实验证明其性能提高。考虑了三种类型的名称实体，包括人名、地名和组织名。结果表明，该系统能够正确翻译大多数名称实体，其准确率为人名 99.86％，地名 99.63％，组织名 99.05％，总体准确率为 99.52％。

May, 2023

使用合成数据进行语音转文本中地址提取的命名实体识别

本文介绍了一种建立在双向编码器变换器（BERT）架构上的命名实体识别（NER）模型的方法，具体使用了 SlovakBERT 模型。该 NER 模型从语音转文本转录获取的数据中提取地址部分。由于真实数据的稀缺性，使用 GPT API 生成了一个合成数据集。强调了在这种人工数据中模仿口语变异的重要性。我们的 NER 模型仅使用合成数据进行训练，并使用小型真实测试数据集进行评估。

Feb, 2024

虚拟代理的端对端口语实体提取

本文探讨了利用语音编码器从语音中直接提取实体的方法，研究表明这种直接的方法优化了编码器以仅转录语音中与实体相关的部分，忽略不必要的部分，并且在企业虚拟代理的对话中，优于传统的两步法。

Feb, 2023

基于端到端的语音命名实体提取

该研究通过一种端到端的神经架构，直接从语音中提取命名实体，并针对语音识别和命名实体识别进行联合优化，相较于传统的流水线方法，实现了更好的命名实体识别结果（测试数据的 F-measure=0.69）

May, 2018

如何处理语音翻译中的人名？

本文通过分析 ASR/ST 系统的输出，针对人名转录 / 翻译的失败原因，采用创建多语言模型并强制系统共同生成转录和翻译的方法，从而显著提高了人名准确性。

May, 2022

零资源跨语言命名实体识别

本文提出一种基于词级对抗训练、参数共享和特征增强的无监督跨语言命名实体识别模型，可在不依靠双语词典或平行数据的情况下，将命名实体知识从一种语言转移到另一种语言。通过对五种不同语言的实验表明，该模型的有效性优于现有模型，并为每个语言对设置了新的 SOTA。

Nov, 2019

英文语音端到端命名实体识别

本文介绍了第一个公开的针对英语语音的命名实体识别 (NER) 数据集，并提出了一种端到端的方法，该方法同时优化 ASR 和 NER 标记器的组件。实验结果表明，所提出的端到端方法优于经典的两步方法，并讨论了如何使用语音的 NER 来处理 ASR 系统中的词汇外单词 (OOV)。

May, 2020