BriefGPT.xyz
大模型
Ask
alpha
关键词
turkic languages
搜索结果 - 4
使用音译法进行突厥语的多语言语音合成
该研究旨在开发一个针对十种低资源的土耳其语言的多语言文本到语音 (TTS) 合成系统,特别针对零样本学习场景,通过用 Tacotron 2 架构基于哈萨克语的数据训练端到端 TTS 系统,基于将土耳其字母映射到国际音标 (IPA) 符号并转
→
PDF
a year ago
UzbekTagger: 一种基于规则的乌兹别克语词性标记器
本研究提出了一个低资源语言乌兹别克语的词性标注数据集和标注工具,使用一种基于规则的标注器,该标注器使用 12 种标签来标注单词的词性,通过使用前缀 / 后缀剥离方法对单词进行词干处理,该工具在乌兹别克文本中标注和识别单词的词性,并且是第一次
→
PDF
a year ago
评估土耳其语系多语言多向 NMT 技术
本研究通过对土耳其语系 22 种语言的大规模机器翻译系统的培训和评估,发现 MNMT 模型在领域外测试集中的表现优于几乎所有双语基线,并在单对下游任务的微调中也获得了巨大的性能提升。
PDF
3 years ago
EMNLP
突厥语言机器翻译的大规模研究
本文是大规模实际应用机器翻译于突厥语系的案例研究,在高、低资源场景下使用平行语料库、双语基准和人工评估结果来识别瓶颈,并提供这些数据与模型的公开开放。
PDF
3 years ago
Prev
Next