如何处理语音翻译中的人名？

May, 2022

Who Are We Talking About? Handling Person Names in Speech Translation

Marco Gaido, Matteo Negri, Marco Turchi

TL;DR本文通过分析 ASR/ST 系统的输出，针对人名转录 / 翻译的失败原因，采用创建多语言模型并强制系统共同生成转录和翻译的方法，从而显著提高了人名准确性。

Abstract

Recent work has shown that systems for speech translation (ST) -- similarly to automatic speech recognition (ASR) -- poorly handle person names. This shortcoming does not only lead to errors that can seriously di

speech translation automatic speech recognition named entities multilingual models person name accuracy

发现论文，激发创造

联合语音翻译和命名实体识别

本篇论文提出了多任务模型将直接语音翻译和命名实体识别相结合，并与传统串行方法进行了对比，在不降低翻译质量的情况下，在命名实体识别任务上显著提高了性能。

Oct, 2022

多语言人名识别和音译

提出了一个探索性工具，它从多语言新闻集合中提取出人名，将同一人物的不同名字匹配起来，并根据这些人名在相关新闻中的共同出现来推断人物间的关系，该工具能匹配包括希腊文、西里尔文和阿拉伯文等不同语言和文字系统中的名字变体，该工作是 NewsExplorer 新闻分析系统的一部分。

Sep, 2006

通过正确翻译命名实体来提高神经机器翻译质量

本文介绍了一种通过将名称实体作为预处理步骤进行翻译 / 音译来提高神经机器翻译质量的方法，并进行了实验证明其性能提高。考虑了三种类型的名称实体，包括人名、地名和组织名。结果表明，该系统能够正确翻译大多数名称实体，其准确率为人名 99.86％，地名 99.63％，组织名 99.05％，总体准确率为 99.52％。

May, 2023

直接言語翻譯中的命名實體檢測與注入

本文探讨了如何利用在特定环境下出现的命名实体词典来提高语音转文本模型的准确性，实验证明使用 NE 词典可以有效提高命名实体的准确性，降低人名错误率达 31%。

Oct, 2022

培育基于性别意识的直接语音翻译系统

本研究探讨无需转录的直接语音翻译模型在性别翻译方面的性别偏见及其潜在危害，并比较不同方法通知模型说话人性别信息的效果，结果表明性别感知模型相比于无性别感知模型在性别标记词的翻译准确率上可提高 30 个百分点，同时保证总体翻译质量。

Dec, 2020

AfriNames: 许多 ASR 模型 “屠杀” 非洲人的姓名

通过多语言预训练、智能数据增强策略以及在多种非洲口音上微调多语言自动语音识别模型，解决使用非洲人名时自动语音识别模型性能下降的问题。相比基准样本，在使用非洲人名的样本上精度相对错误率改善了 81.5%。

Jun, 2023

将语言模型整合到直接语音翻译中：一种控制性别屈折的推理时间解决方案

用于语音翻译系统的控制说话者性别变化的解决方案通过使用性别特定的外部语言模型，在性别准确性方面比基本模型和最好的训练时间缓解策略分别提高了 31.0 和 1.6 个百分点，特别是在说话者的声音特征与性别相冲突的情况下，增益甚至更大（最多 32.0 和 3.4 个百分点）。

Oct, 2023

移动设备端基于端到端语音识别的个性化命名实体识别

通过使用不同的个性化技术来提高语音识别的效果，我们提出了一种基于关键词精度和召回率的词汇获取性能评估方法，并在设计的包含难以识别人名的数据集上进行了算法评估，其中，数据合成方法可以将基线的人名召回率从 2.4% 提高到 48.6%。在进行名字修正的情况下，名字召回率可提高至 64.4%。通过在移动设备上执行整个个性化工作流程，我们摆脱了上传用户数据和在服务器上存储个性化模型的需要。

Dec, 2019

L1 和 L2 瑞典语说话者的 ASR 结果比较分析

使用词错误率比较母语和非母语、朗读和即兴的瑞典话语在不同的 ASR 服务中的识别结果，并分析可能导致观察到的转录错误的语言因素。

May, 2024

交互解码同步语音识别与语音文本翻译

本文提出了一种新的交互式注意机制，使自动语音识别和语音翻译在单个模型中可以同步地和交互地进行，实验表明，该模型在语音翻译和语音识别方面的性能表现均优于基线模型。

Dec, 2019