这篇论文研究了自我监督模型在大语音语料库中训练的近期进展,并比较了几种学习策略以减少计算时间和能源消耗成本,但保持竞争性能表现。
Jul, 2022
本文介绍了一个手动注释的法语新闻语料库,用于引述提取和来源归属。语料库详细描述了数据选择和注释指南,统计了引述类型的平衡情况,并展示了参与手动标注的 8 名注释员之间的高的注释者一致性。
Sep, 2023
本文介绍了使用 LibriSpeech 增强现有单语语料库的方法,建立起一种包含源语言中的语音与目标语言中的文本的大型开放式平行语料库,并给出了相应的处理细节和手动评估结果,该平行语料库可以用于直接语音翻译或其他口语翻译实验。
Feb, 2018
本论文提出了一种直接自动生成目标语言字幕及相应时间戳的自动字幕模型,与现有的级联模型相比,在提供高质量字幕的同时也具有更高的一致性和维护单一模型的优点。
Sep, 2022
该研究提出了一种基于注意力机制的端到端学习的序列到序列神经网络,能够直接将一种语言的语音翻译成另一种语言的语音,无需中间文本表示,该方法通过学习将语音谱图映射到目标语言的谱图,同时也演示了译后语音合成的能力。研究在两个西班牙语到英语的语音翻译数据集上进行了实验,证明了该方法在这个极具挑战的任务上的可行性。
Apr, 2019
本文综述了直接语音翻译的当前技术状况,将现有研究工作分为三个方向:建模负担,数据稀缺和应用问题,并提出了未来工作的一些有前途的方向。
Jun, 2023
本文以法语为案例研究,从语言学的角度探讨自动语音识别系统在复杂语境下的识别准确度,并解决了法语同音词的歧义问题,提高了法语语音转写准确度。
Nov, 2022
本文提出一种新方法,自动构建对话机器翻译的平行话语语料库,经实验表明,采用该方法可以显著提高翻译质量,同时公开了大约 10 万条已经手动标注了发言者和对话边界的平行话语数据。
May, 2016
本文主要介绍了对 Frisian—Dutch code-switching 语音进行自动化标注和学习的几种方法,并探索了扩充语音数据的方法以提高类似语音识别模型的效果的研究。
Oct, 2018
本研究构建并训练了一种基于自动语音识别技术的语言识别系统,可自动识别阿拉伯语、西班牙语、法语和土耳其语,并通过投票方式进行预测,准确率很高。
May, 2022