瑞士德语语音转文本系统评估

Jul, 2022

Swiss German Speech to Text system evaluation

Yanick Schraner, Christian Scheller, Michel Plüss, Manfred Vogel

TL;DR针对四个商业可用的瑞士德语语音转文本系统和 FHNW 模型展开深入评估，并使用瑞士议会语料库和新闻域中的私人数据集来评估这些模型，并提供了有关模型培训的详细信息，评估了这些模型的强弱点并对其进行了详细的错误分析。

Abstract

We present an in-depth evaluation of four commercially available Speech-to-Text (STT) systems for swiss german. The systems are anonymized and referred to as system a-d in this report. We compare the four systems to our

speech-to-text systems swiss german stt model bleu score error analysis

发现论文，激发创造

STT4SG-350: 一份面向瑞士所有德语方言地区的语音语料库

提供了一份瑞士德语语音的语料库，包含了来自各个方言区的 316 名发言者的 343 小时语音数据，并提供了这些发言者的方言、年龄和性别信息。该语料库适用于自动语音识别、文本到语音、方言识别和说话人识别等应用领域，并提供了训练集、验证集和测试集，训练出的模型在测试集上取得了较好的效果。

May, 2023

2022 年 SwissText 第二届瑞士德语口语转标准德语文本共享任务

此研究报告了 2022 年 SwissText 会议上第二次瑞士德语转标准德语文本共享任务的结果和发现，参与者被要求构建针对 Grisons 方言的以句子为单位的瑞士德语语音到标准德语文本系统，目标是在 Grisons 语音的测试集上最大化 BLEU 成绩。共有 3 支队伍参赛，最佳表现系统的 BLEU 得分为 70.1。

Jan, 2023

瑞士德语文本转语音流程 -- 一项比较

研究使用不同的 TTS 模型合成瑞士德语，发现 VITS 模型表现最佳，使用判别器对模型进行评估，在不同的瑞士德语方言中实现了以前无法达到的语音合成质量。

May, 2023

Whisper 是否理解瑞士德语？自动化质量评估与人工评价

Whisper 是一种最先进的自动语音识别（ASR）模型，经过系统评估后，我们的所有评估结果表明，Whisper 是一个适用于瑞士德语的可行 ASR 系统，前提是需要标准德语输出。

Apr, 2024

真实数据上的无字幕语音翻译

我们提出了一种无需文本数据即可构建的无文本语音到语音翻译系统，采用了自监督单元级别的语音标准化技术来优化多说话者语音的模型，仅使用了 10 分钟的数据训练该技术，可在 VoxPopuli S2ST 数据集上实现平均 3.2 BLEU 分数的增益，是首次建立了可用于多种语言对的无文本 S2ST 技术。

Dec, 2021

SDS-200: 一份瑞士德语转标准德语文本语料库

SDS-200 是一份包含瑞士德语方言语音的语料库，其中标注了方言、年龄和性别等信息，可以用于训练语音翻译、方言识别和语音合成系统等。该数据集包含约 4000 名不同说话者的 200 小时的语音，并覆盖了瑞士德语方言的大部分领域。我们同时发布了 SDS-200 基线语音翻译模型和使用 SDS-200 微调预训练的 XLS-R 模型，最终达到了 21.6 WER 和 64.0 BLEU。

May, 2022

知识蒸馏的端到端语音翻译：FBK@IWSLT2020

本文介绍了 FBK 参加 IWSLT 2020 离线语音翻译任务的方法和成果，使用基于 Transformer 模型的端到端系统，并运用了 ASR 预训练、数据增强、多任务学习等技术，最佳 BLEU 得分达到 29，优于最近相关研究。

Jun, 2020

Spaiche：扩展最先进的 ASR 模型以支持瑞士德语方言

本研究旨在提高 ASR 模型在瑞士德语方言上的表现，通过提供对最新发布的瑞士德语语音数据集上现有现有 ASR 模型性能的深入了解。我们提出了一种考虑预测和真实标签之间语义距离的新型损失函数，通过对 Swiss-German 数据集上 OpenAI 的 Whisper 模型进行微调，取得了优于当前最新研究成果的结果。

Apr, 2023

低资源口音方言的机器翻译：规范瑞士德语的策略

设计了一种机器翻译系统，使用字符级神经网络翻译文本，并结合基于短语的统计翻译，实现了对伯尔尼方言的 36% BLEU 得分的翻译。这些资源和规范化技术是通向瑞士德语方言全面机器翻译的第一步。

Oct, 2017

StatBot.Swiss: 双语自然语言下的开放数据探索

使用大型语言模型（LLMs）在 Text-to-SQL 系统方面的潜力主要集中在英文单语数据集上的评估，然而，LLMs 在其他语言上的表现鲜有研究。本研究发布了 StatBot.Swiss 数据集，这是第一个基于真实应用程序评估 Text-to-SQL 系统的双语基准数据集。StatBot.Swiss 数据集包含了 455 个英文和德文之间的自然语言 / SQL 对，涵盖了 35 个不同难度级别的大型数据库。我们使用 GPT-3.5-Turbo 和 mixtral-8x7b-instruct 等最先进的 LLMs 来评估 Text-to-SQL 翻译任务的性能，并采用上下文学习方法。我们的实验分析表明，目前的 LLMs 在生成 SQL 查询语句方面在我们的新型双语数据集上普遍存在泛化能力不佳的问题。

Jun, 2024