文本转语音中的非标准越南语词语检测和规范化

Sep, 2022

文本转语音中的非标准越南语词语检测和规范化

Non-Standard Vietnamese Word Detection and Normalization for Text-to-Speech

Huu-Tien Dang, Thi-Hai-Yen Vuong, Xuan-Hieu Phan

TL;DR本文提出了一种新的两阶段文本标准化方法解决语音合成中的 NSWs（数字，日期，范围，分数，缩写，URL，电子邮件，哈希标签和联系人名字）语义歧义和发音问题。第一个阶段使用基于模型的标注器检测 NSWs，第二个阶段使用基于正向词典的最大匹配算法将哈希标签，电子邮件地址和联系人名字等 NSWs 拆分为发音形式。实验结果表明，该方法的错误率较低，达到 6.67％。

Abstract

Converting written texts into their spoken forms is an essential problem in any text-to-speech (TTS) systems. However, building an effective text normalization solution for a real-world TTS system face two main c

text-to-speech normalization non-standard words syllables tagger

发现论文，激发创造

自动文本规范化用于仇恨言论检测

社交媒体数据是研究的宝贵资源，非标准词汇是对 NLP 工具运行的一种障碍。我们采用了一种简单的序列到序列模型，通过文本规范化的实验结果显示准确率接近 70%，同时也提升了 2% 左右的仇恨言论检测任务的准确性，展示了提高复杂 NLP 任务性能的潜力。

Nov, 2023

利用多任务神经网络模拟噪声以识别社交媒体中的命名实体

本文提出两种利用字符级音韵、词嵌入和词性标注等特征解决社交媒体文本处理困难的模型，比现有技术在噪声环境下的表现更好， F1 得分比之前提高了 2.45% 和 3.69%。

Jun, 2019

四合一：联合逆文本规范化、标点、大写和表达不流畅对于自动语音识别的方法

本文提出一种统一的自动语音转换为书写形式文本的方法，使用了一个两阶段的过程实现了逆文本规范化、标点符号、大写和不流畅的统一标注，然后使用权重有限状态转换器语法来格式化标注的 ITN 实体跨度。该方法在自然语言处理中的成果优于专门的模型。

Oct, 2022

基于多语言 Transformer 的序列 - 序列词汇规范化

本论文通过使用基于 mBART 的句子级序列到序列模型，将自然语言处理中的标准化问题归结为机器翻译问题，利用多语言预训练技术进行 fine-tuned，优于操作原始社交媒体文本的模型，在下游任务中实现性能提升。

Oct, 2021

文本标准化的循环神经网络方法：一项挑战

该论文介绍了一个挑战：给定一个大型的文本语音对齐数据集，通过训练递归神经网络 (RNN) 来学习正确的文本归一化函数。论文提供了一个通用文本数据集，其中归一化是使用现有的文本到语音系统的文本归一化组件生成的，并表明简单的 FST 过滤器可以减轻 RNN 产生的错误，旨在为序列到序列建模提供一个新的数据集，以期寻找更好的解决方案。

Oct, 2016

基于非标准词的文本分类特征

本文介绍了使用非标准单词（非标准单词包括数字、日期、缩写、货币等）作为特征来进行分析克罗地亚语文本的分类。实验结果表明，使用非标准单词频率作为特征的分类准确率最高为 87％。此外，作者认为在高度变形的语言中，应该考虑使用基于非标准单词的功能来降低特征空间的维度，而无需使用标准分类过程。

Aug, 2014

利用正则表达式规范化立陶宛文本

文本归一化是文本到语音合成系统的一个重要组成部分，需要识别并扩展非标准词以及应用适合立陶宛语的符号类别，基于正则表达式创建规则集并通过实验评估准确性，解释错误的原因并提供文本归一化规则发展的建议。

Dec, 2023

克罗地亚文本中的非标准词归一化

本文介绍了文本归一化的方法，包括使用基于规则和查找字典的方法，以及提出用于分类克罗地亚语非标准单词的整个分类法。效果显示，针对克罗地亚语的文本归一化的标记率为 95％，其中 80％的扩展单词以正确的形态呈现。

Mar, 2015

有限状态转换器和语言模型的浅层融合用于文本规范化

该研究提出了一种基于加权有限状态转换器和神经语言模型的混合方法，以解决文本归一化的上下文依赖性问题。

Mar, 2022

越南语中基于方面的情感分析的跨度检测

本研究提出了一种基于 BiLSTM-CRF 的新颖系统，利用收集的词汇和语境特征，针对基于方面的情感分析中的波及用户观点的判定问题，利用越南语语言数据集进行评估，最终实现了 62.76% 的 F1 分数的最优解。

Oct, 2021