瑞士德语语音翻译的方言迁移
设计了一种机器翻译系统,使用字符级神经网络翻译文本,并结合基于短语的统计翻译,实现了对伯尔尼方言的 36% BLEU 得分的翻译。这些资源和规范化技术是通向瑞士德语方言全面机器翻译的第一步。
Oct, 2017
此研究报告了 2022 年 SwissText 会议上第二次瑞士德语转标准德语文本共享任务的结果和发现,参与者被要求构建针对 Grisons 方言的以句子为单位的瑞士德语语音到标准德语文本系统,目标是在 Grisons 语音的测试集上最大化 BLEU 成绩。共有 3 支队伍参赛,最佳表现系统的 BLEU 得分为 70.1。
Jan, 2023
本研究旨在提高 ASR 模型在瑞士德语方言上的表现,通过提供对最新发布的瑞士德语语音数据集上现有现有 ASR 模型性能的深入了解。我们提出了一种考虑预测和真实标签之间语义距离的新型损失函数,通过对 Swiss-German 数据集上 OpenAI 的 Whisper 模型进行微调,取得了优于当前最新研究成果的结果。
Apr, 2023
提供了一份瑞士德语语音的语料库,包含了来自各个方言区的 316 名发言者的 343 小时语音数据,并提供了这些发言者的方言、年龄和性别信息。该语料库适用于自动语音识别、文本到语音、方言识别和说话人识别等应用领域,并提供了训练集、验证集和测试集,训练出的模型在测试集上取得了较好的效果。
May, 2023
针对四个商业可用的瑞士德语语音转文本系统和 FHNW 模型展开深入评估,并使用瑞士议会语料库和新闻域中的私人数据集来评估这些模型,并提供了有关模型培训的详细信息,评估了这些模型的强弱点并对其进行了详细的错误分析。
Jul, 2022
SDS-200 是一份包含瑞士德语方言语音的语料库,其中标注了方言、年龄和性别等信息,可以用于训练语音翻译、方言识别和语音合成系统等。该数据集包含约 4000 名不同说话者的 200 小时的语音,并覆盖了瑞士德语方言的大部分领域。我们同时发布了 SDS-200 基线语音翻译模型和使用 SDS-200 微调预训练的 XLS-R 模型,最终达到了 21.6 WER 和 64.0 BLEU。
May, 2022
研究使用不同的 TTS 模型合成瑞士德语,发现 VITS 模型表现最佳,使用判别器对模型进行评估,在不同的瑞士德语方言中实现了以前无法达到的语音合成质量。
May, 2023
本文通过全面评估最有影响力的最新大型语言模型(LLMs)在机器翻译和自动语音识别两个高使用频率应用领域上的功能,对多个高和低资源语言的地区方言进行了功能评估,并分析了地方方言差距与经济、社会和语言因素的相关性,从而为方言 NLP 领域的发展奠定基础,并通过有意识的数据收集,揭示明显的差异并寻找可能的解决途径。
Oct, 2023
调查表明,使用方言输入的潜在自然语言处理工具受到说方言的德语方言和地方语言使用者的欢迎,而方言输出的应用(如机器翻译或拼写检查)则不太受欢迎。
Feb, 2024