non-standard words | BriefGPT

关键词non-standard words

搜索结果 - 4

利用正则表达式规范化立陶宛文本
文本归一化是文本到语音合成系统的一个重要组成部分，需要识别并扩展非标准词以及应用适合立陶宛语的符号类别，基于正则表达式创建规则集并通过实验评估准确性，解释错误的原因并提供文本归一化规则发展的建议。
PDF6 months ago
自动文本规范化用于仇恨言论检测
社交媒体数据是研究的宝贵资源，非标准词汇是对 NLP 工具运行的一种障碍。我们采用了一种简单的序列到序列模型，通过文本规范化的实验结果显示准确率接近 70%，同时也提升了 2% 左右的仇恨言论检测任务的准确性，展示了提高复杂 NLP 任务性
PDF8 months ago
文本转语音中的非标准越南语词语检测和规范化
本文提出了一种新的两阶段文本标准化方法解决语音合成中的 NSWs（数字，日期，范围，分数，缩写，URL，电子邮件，哈希标签和联系人名字）语义歧义和发音问题。第一个阶段使用基于模型的标注器检测 NSWs，第二个阶段使用基于正向词典的最大匹配算
PDF2 years ago
MM基于非标准词的文本分类特征
本文介绍了使用非标准单词（非标准单词包括数字、日期、缩写、货币等）作为特征来进行分析克罗地亚语文本的分类。实验结果表明，使用非标准单词频率作为特征的分类准确率最高为 87％。此外，作者认为在高度变形的语言中，应该考虑使用基于非标准单词的功
PDF10 years ago