May, 2022

将濒危语言引入数字时代:犹太西班牙语案例研究

TL;DR本研究致力于通过机器翻译和语音合成系统来促进西班牙犹太语(Sephardic Jews 的流亡语言)的复兴,通过创建语料库和工具,帮助保存这种语言,研究者使用规则驱动的机器翻译系统将西班牙语翻译成犹太西班牙语,生成大量的合成平行数据,并根据犹太西班牙语社区的翻译创建了真实的平行数据,训练了基于神经网络的机器翻译引擎,同时还开发了单一发言人的 3.5 小时语音语料库,用于构建神经语音合成引擎,并公开共享了相关资源和引擎。