BriefGPT.xyz
Ask
alpha
关键词
writing systems
搜索结果 - 3
MC^2: 中国少数民族语言的多语种语料库
MC^2 是迄今为止最大的开源多语言少数民族语言语料库,涵盖了西藏语、维吾尔语、哈萨克语(哈萨克阿拉伯文)和蒙古语(传统蒙古文)等四种弱势语言,着重解决现有多语言语料库中有限的资源语言分割问题,并分析了长文本建模和多重书写系统等带来的新研究
→
PDF
8 months ago
GlotScript: 低资源书写系统识别的资源与工具
GlotScript 是一个开放资源和工具,用于低资源写作系统识别,提供了超过 7000 种语言的已验证写作系统,并且通过整合现有写作系统资源编制。GlotScript-T 是一个涵盖了 161 个 Unicode 15.0 脚本的写作系统
→
PDF
9 months ago
EMNLP
高度多语言神经音素转写
本文提出了使用神经序列到序列模型进行语音转换的方法,这个方法可以用在多种语言上,并且相比于基于高资源单语言模型适应低资源语言的方法,我们的方法在语音识别上的表现有显著提升,同时我们的模型更加紧凑。
PDF
7 years ago
Prev
Next