瑞士德语语音转文本系统评估
提供了一份瑞士德语语音的语料库,包含了来自各个方言区的 316 名发言者的 343 小时语音数据,并提供了这些发言者的方言、年龄和性别信息。该语料库适用于自动语音识别、文本到语音、方言识别和说话人识别等应用领域,并提供了训练集、验证集和测试集,训练出的模型在测试集上取得了较好的效果。
May, 2023
此研究报告了 2022 年 SwissText 会议上第二次瑞士德语转标准德语文本共享任务的结果和发现,参与者被要求构建针对 Grisons 方言的以句子为单位的瑞士德语语音到标准德语文本系统,目标是在 Grisons 语音的测试集上最大化 BLEU 成绩。共有 3 支队伍参赛,最佳表现系统的 BLEU 得分为 70.1。
Jan, 2023
研究使用不同的 TTS 模型合成瑞士德语,发现 VITS 模型表现最佳,使用判别器对模型进行评估,在不同的瑞士德语方言中实现了以前无法达到的语音合成质量。
May, 2023
Whisper 是一种最先进的自动语音识别(ASR)模型,经过系统评估后,我们的所有评估结果表明,Whisper 是一个适用于瑞士德语的可行 ASR 系统,前提是需要标准德语输出。
Apr, 2024
我们提出了一种无需文本数据即可构建的无文本语音到语音翻译系统,采用了自监督单元级别的语音标准化技术来优化多说话者语音的模型,仅使用了 10 分钟的数据训练该技术,可在 VoxPopuli S2ST 数据集上实现平均 3.2 BLEU 分数的增益,是首次建立了可用于多种语言对的无文本 S2ST 技术。
Dec, 2021
SDS-200 是一份包含瑞士德语方言语音的语料库,其中标注了方言、年龄和性别等信息,可以用于训练语音翻译、方言识别和语音合成系统等。该数据集包含约 4000 名不同说话者的 200 小时的语音,并覆盖了瑞士德语方言的大部分领域。我们同时发布了 SDS-200 基线语音翻译模型和使用 SDS-200 微调预训练的 XLS-R 模型,最终达到了 21.6 WER 和 64.0 BLEU。
May, 2022
本文介绍了 FBK 参加 IWSLT 2020 离线语音翻译任务的方法和成果,使用基于 Transformer 模型的端到端系统,并运用了 ASR 预训练、数据增强、多任务学习等技术,最佳 BLEU 得分达到 29,优于最近相关研究。
Jun, 2020
本研究旨在提高 ASR 模型在瑞士德语方言上的表现,通过提供对最新发布的瑞士德语语音数据集上现有现有 ASR 模型性能的深入了解。我们提出了一种考虑预测和真实标签之间语义距离的新型损失函数,通过对 Swiss-German 数据集上 OpenAI 的 Whisper 模型进行微调,取得了优于当前最新研究成果的结果。
Apr, 2023
设计了一种机器翻译系统,使用字符级神经网络翻译文本,并结合基于短语的统计翻译,实现了对伯尔尼方言的 36% BLEU 得分的翻译。这些资源和规范化技术是通向瑞士德语方言全面机器翻译的第一步。
Oct, 2017
使用大型语言模型(LLMs)在 Text-to-SQL 系统方面的潜力主要集中在英文单语数据集上的评估,然而,LLMs 在其他语言上的表现鲜有研究。本研究发布了 StatBot.Swiss 数据集,这是第一个基于真实应用程序评估 Text-to-SQL 系统的双语基准数据集。StatBot.Swiss 数据集包含了 455 个英文和德文之间的自然语言 / SQL 对,涵盖了 35 个不同难度级别的大型数据库。我们使用 GPT-3.5-Turbo 和 mixtral-8x7b-instruct 等最先进的 LLMs 来评估 Text-to-SQL 翻译任务的性能,并采用上下文学习方法。我们的实验分析表明,目前的 LLMs 在生成 SQL 查询语句方面在我们的新型双语数据集上普遍存在泛化能力不佳的问题。
Jun, 2024