本篇论文提出了多任务模型将直接语音翻译和命名实体识别相结合,并与传统串行方法进行了对比,在不降低翻译质量的情况下,在命名实体识别任务上显著提高了性能。
Oct, 2022
提出了一个探索性工具,它从多语言新闻集合中提取出人名,将同一人物的不同名字匹配起来,并根据这些人名在相关新闻中的共同出现来推断人物间的关系,该工具能匹配包括希腊文、西里尔文和阿拉伯文等不同语言和文字系统中的名字变体,该工作是 NewsExplorer 新闻分析系统的一部分。
Sep, 2006
本文介绍了一种通过将名称实体作为预处理步骤进行翻译 / 音译来提高神经机器翻译质量的方法,并进行了实验证明其性能提高。考虑了三种类型的名称实体,包括人名、地名和组织名。结果表明,该系统能够正确翻译大多数名称实体,其准确率为人名 99.86%,地名 99.63%,组织名 99.05%,总体准确率为 99.52%。
May, 2023
本文探讨了如何利用在特定环境下出现的命名实体词典来提高语音转文本模型的准确性, 实验证明使用 NE 词典可以有效提高命名实体的准确性,降低人名错误率达 31%。
本研究探讨无需转录的直接语音翻译模型在性别翻译方面的性别偏见及其潜在危害,并比较不同方法通知模型说话人性别信息的效果,结果表明性别感知模型相比于无性别感知模型在性别标记词的翻译准确率上可提高 30 个百分点,同时保证总体翻译质量。
Dec, 2020
通过多语言预训练、智能数据增强策略以及在多种非洲口音上微调多语言自动语音识别模型,解决使用非洲人名时自动语音识别模型性能下降的问题。相比基准样本,在使用非洲人名的样本上精度相对错误率改善了 81.5%。
Jun, 2023
用于语音翻译系统的控制说话者性别变化的解决方案通过使用性别特定的外部语言模型,在性别准确性方面比基本模型和最好的训练时间缓解策略分别提高了 31.0 和 1.6 个百分点,特别是在说话者的声音特征与性别相冲突的情况下,增益甚至更大(最多 32.0 和 3.4 个百分点)。
Oct, 2023
通过使用不同的个性化技术来提高语音识别的效果,我们提出了一种基于关键词精度和召回率的词汇获取性能评估方法,并在设计的包含难以识别人名的数据集上进行了算法评估,其中,数据合成方法可以将基线的人名召回率从 2.4% 提高到 48.6%。在进行名字修正的情况下,名字召回率可提高至 64.4%。通过在移动设备上执行整个个性化工作流程,我们摆脱了上传用户数据和在服务器上存储个性化模型的需要。
Dec, 2019
使用词错误率比较母语和非母语、朗读和即兴的瑞典话语在不同的 ASR 服务中的识别结果,并分析可能导致观察到的转录错误的语言因素。
May, 2024
本文提出了一种新的交互式注意机制,使自动语音识别和语音翻译在单个模型中可以同步地和交互地进行,实验表明,该模型在语音翻译和语音识别方面的性能表现均优于基线模型。