BriefGPT.xyz
Ask
alpha
关键词
diacritics restoration
搜索结果 - 4
使用 ByT5 转换器模型纠正变音符号和错别字
本研究使用新开发的通用 ByT5 字节级 seq2seq transformer 模型,同时解决语言中的变音符号恢复和拼写错误的问题,在 13 种语言中展现强大的表现,相较于传统的拼写检查或基于词典的方法表现更佳。
PDF
2 years ago
用于轻量化变音符恢复的扩张卷积神经网络
本研究提出了一种基于一维膨胀卷积的字符级别方法,用于重建拉丁字母为基础、英语为主导的互联网语言环境中的发音符号。该方法比基于递归神经网络或语言建模的方法表现更佳,且适用于 Web 浏览器,尤其适用于匈牙利语等语言的应用。
PDF
2 years ago
使用 BERT 进行变音符号恢复并分析其在捷克语中的应用
本文提出了一种基于上下文化嵌入(BERT)的新型变音符号恢复体系结构,并在 12 种带有变音符号的语言上进行了评估。此外,我们对捷克语进行了详细的错误分析,最终我们对真实错误进行了分类。
PDF
3 years ago
MM
基于注意力机制的序列到序列学习在 Yorùbá 语文本的音标恢复中的应用
本论文提出了两种不同的基于注意力机制的序列到序列神经网络模型来处理未带变音符的约鲁巴语文本,将自动变音符恢复重新定位为机器翻译任务。在评估数据集上,这种方法产生少于 5%的变音符错误率,并开源了预训练模型、数据集和源代码项目,以推进约鲁巴语
→
PDF
6 years ago
Prev
Next