BriefGPT.xyz
Ask
alpha
关键词
non-standard words
搜索结果 - 4
利用正则表达式规范化立陶宛文本
文本归一化是文本到语音合成系统的一个重要组成部分,需要识别并扩展非标准词以及应用适合立陶宛语的符号类别,基于正则表达式创建规则集并通过实验评估准确性,解释错误的原因并提供文本归一化规则发展的建议。
PDF
6 months ago
自动文本规范化用于仇恨言论检测
社交媒体数据是研究的宝贵资源,非标准词汇是对 NLP 工具运行的一种障碍。我们采用了一种简单的序列到序列模型,通过文本规范化的实验结果显示准确率接近 70%,同时也提升了 2% 左右的仇恨言论检测任务的准确性,展示了提高复杂 NLP 任务性
→
PDF
8 months ago
文本转语音中的非标准越南语词语检测和规范化
本文提出了一种新的两阶段文本标准化方法解决语音合成中的 NSWs(数字,日期,范围,分数,缩写,URL,电子邮件,哈希标签和联系人名字)语义歧义和发音问题。第一个阶段使用基于模型的标注器检测 NSWs,第二个阶段使用基于正向词典的最大匹配算
→
PDF
2 years ago
MM
基于非标准词的文本分类特征
本文介绍了使用非标准单词 (非标准单词包括数字、日期、缩写、货币等)作为特征来进行分析克罗地亚语文本的分类。实验结果表明,使用非标准单词频率作为特征的分类准确率最高为 87%。此外,作者认为在高度变形的语言中,应该考虑使用基于非标准单词的功
→
PDF
10 years ago
Prev
Next