关键词agglutinative languages
搜索结果 - 7
- 马拉雅拉姆语改写生成的神经机器翻译
该研究探讨了四种生成马拉雅拉姆语释义的方法,利用了英语释义和预训练的神经机器翻译模型的资源。我们使用自动化评估指标(如 BLEU、METEOR 和余弦相似度)和人工标注来评估生成的释义。我们的发现表明,自动化评估指标可能不完全适用于马拉雅拉 - 韩语中的词分割粒度
这篇论文研究了韩语语言处理中的词分割粒度,通过将韩语从以空格分隔的词(eojeol)转化为一系列的语素,我们发现韩语存在多种可能的词分割粒度。对于特定的语言处理和语料库标注任务,已经提出和使用了几种不同的粒度级别,因为包括韩语在内的凝聚语言 - 奇妙的汇合语言对跨语言迁移学习的影响
研究多语言语言模型的训练选择对于跨语言迁移学习至关重要,韩语等粘着语言的使用在跨语言迁移学习中效果更佳。这是一项重大发现,将改变跨语言迁移学习的训练策略。
- 低资源语音识别的语音合成数据增强
本研究旨在提出一种新的数据增强方法来改善自动语音识别模型,该方法生成合成文本和合成音频,使用该方法可以提高 Quechua 语言的 ASR 模型的词错误率(WER)达到 8.73%的改善。
- 神经机器翻译上的聚合语言词形分割
本研究提出了一种基于形态学的单词分割方法,能够在训练时缩小词汇表的同时保留词结构中的语言和语义信息,以协助神经机器翻译,实验结果表明此方法能显著提高土耳其 - 英语和维吾尔 - 中文机器翻译任务的性能,降低数据稀疏性和语言复杂性。
- EMNLP聚合语言音节级神经语言模型
提出了一种利用音节和词素衍生的嵌入来弥补粘着语言中的词汇外问题的方法,该模型比具有 9.50M 参数的字符级嵌入在困惑度上表现出色 16.87。所提出的方法在键击节省方面实现了现有输入预测方法的最新性能,并已商业化。
- ACL基于卷积神经网络的字符构成模型用于形态丰富语言的依存句法分析
该研究提出了一种基于转移的依存句法分析器,使用卷积神经网络来从字符中组合单词表示。字符组合模型在解析结合语言方面表现出显著的改进,这些改进甚至比使用额外数据训练的预训练词嵌入模型更好。在 SPMRL 数据集上,与之前最好的贪心解析器相比,我