格网句与自然句对正常音量转化效果的比较研究

Sep, 2023

格网句与自然句对正常音量转化效果的比较研究

A comparative study of Grid and Natural sentences effects on Normal-to-Lombard conversion

Hongyang Chen, Yuhong Yang, Qingmu Liu, Baifeng Li, Weiping Tu...

TL;DR这篇论文通过对《Lombard Chinese TIMIT (LCT)》和《Enhanced MAndarin Lombard Grid corpus (EMALG)》的比较，研究了格状句对于提高自然语音可懂性的效果以及通过参数分析发现了噪音水平的增加使得格状句和自然句都表现出类似的变化，但是在alpha比率的增加方面，格状句呈现出更大的增长，最后通过主观可懂性评估发现在性别和信噪比方面，EMALG上训练的StarGAN模型在提高可懂性方面始终优于LCT上训练的模型，这种优越的表现可能归因于EMALG中从正常语音到Lombard语音的alpha比率增长更大。

Abstract

Grid sentence is commonly used for studying the lombard effect and normal-to-lombard conversion. However, it's unclear if Normal-to-Lombard models trained on →

发现论文，激发创造

低资源口音方言的机器翻译: 规范瑞士德语的策略

设计了一种机器翻译系统，使用字符级神经网络翻译文本，并结合基于短语的统计翻译，实现了对伯尔尼方言的36% BLEU得分的翻译。这些资源和规范化技术是通向瑞士德语方言全面机器翻译的第一步。

Oct, 2017

神经机器翻译快速适应新语言

本文提出了針對低資源語言進行神經機器翻譯系統適應的策略，基於大規模的多語言種子模型，通過將訓練擴展到相關低資源語言數據上，與高資源語言一起進行聯合訓練，實現了相似語言正則化策略，實驗表明在4個低資源語言環境下，BLEU得分平均提高了1.7。

Aug, 2018

提高语音翻译的稳健性

提出了一种简单且有效的方法来改进神经机器翻译在语音翻译中的稳健性，通过在干净的平行数据集中注入真实输出中存在的噪声以及结合拼音特征，使NMT可以在类似的单词分布下进行训练和测试，实验结果表明，该方法在多个噪声测试集上的稳定性表现优异，并在WMT'17中英测试集上取得了泛化性能的提高。

Nov, 2018

基于规则引导的平面格变换器的端到端中文文本规范化模型

提出了一种中文文本归一化模型，将规则中的专家知识融合到神经网络中，从而提高了性能。同时，公开了一份中文文本归一化的大规模数据集。

Mar, 2022

ElitePLM：预训练语言模型通用语言能力评估的实证研究

本文介绍了一个对预训练语言模型（PLMs）的普适语言能力进行大规模实证研究的ElitePLM，并设计了四个评估维度来衡量十种广泛使用的PLMs，包括记忆、理解、推理和组合。实验结果表明，PLMs在不同的能力测试中表现出色; 下游任务中的微调通常对数据大小和分布敏感; PLMs在类似任务之间具有出色的可转移性，并且 PLMs的预测结果在我们的实验中作为开放资源发布，以进行更深入和详细的PLMs语言能力分析。这篇论文可以引导未来的工作选择，应用和设计特定任务的PLMs。

May, 2022

ParaTTS:基于段落的语音合成中学习跨句子的语言和韵律信息

本文提出了一种基于跨句嵌入结构的TTS模型，包含语言学信息，韵律信息和位置信息，并在女性普通话语音书籍语料库上进行了训练，结果表明该模型能够生成自然、优质的段落朗读文本，且在主观和客观测试中都表现优于基于句子的模型。

Sep, 2022

SQuId: 在多种语言中测量语音自然度

本研究介绍了SQuId（Speech Quality Identification），这是一种多语言自然度预测模型，受过百万次评级的训练，测试了65个不同地方的数据，表明在多个语言环境下训练一个模型比单一语言更优，可以在不同语种中传递学习，关注调音数据以及设计决策的影响。

Oct, 2022

预训练如何改善基于语篇的翻译？

本研究探讨了预训练语言模型在捕捉篇章关系上的能力，并通过探究任务验证了不同架构和层数的PLMs的表现，得出了对于不同NMT任务在何种情况下使用不同层的PLMs是最好的决策。

May, 2023

CIF-Bench：一个用于评估大型语言模型通用性的中文指令遵循基准

LLMs在处理中文任务方面存在限制，该研究引入了中文指令跟踪基准（CIF-Bench），评估LLMs对中文语言的零射击泛化能力，并揭示出评估偏差和性能差距问题。

Feb, 2024

推进语音翻译：普通话-英语电话会话语料库

本文介绍了英语翻译，适用于部分通话家庭普通话数据和香港科技大学普通话电话语音数据的语音翻译任务。研究表明，将通用翻译模型微调为普通话-英语对话电话语音训练集可以使目标领域BLEU提高8个百分点以上，突显了配对训练数据的重要性。

Mar, 2024