关键词morphologically rich languages
搜索结果 - 29
- 基于语言学的土耳其语到英语神经机器翻译词汇量缩减
本文提出了一种新的神经机器翻译方法,可以考虑语言的词形属性,基于无监督的形态学习在任何速率下减少给定输入语料库的词汇量,并在土耳其语 - 英语 NMT 任务中通过比较生成输出的语义和句法特性来验证方法的效果,与传统词汇量缩减技术相比,显著提 - ACL低资源语言的跨语言形态标注
提出了一种适用于低资源语言的模型来训练形态标记器,该模型使用 Wesabie 模型进行打标, 通过在语料库中引入 POS 词性标注的元信息,将标记信息从富资源语言映射到贫资源语言,实现了跨语言知识的迁移,可以提高句法分析的效果。
- 神经机器翻译中适用于形态丰富语言的词表示模型
本文提出了使用字符和形态级别单词分解学习单词表示的若干结构,并将这些表示法纳入一种新颖的机器翻译模型中,通过一个硬注意力机制联合学习单词对齐和翻译,从而提高 morphologically rich languages 翻译成英语的机器翻译 - ACL优化谱学习以进行语法分析
本文研究了使用谱方法来估计潜在变量 PCFGs 时优化潜在状态数量的搜索算法,结果表明,全局优化每个非终结符的潜在状态数量并考虑不同非终结符之间的交互对语法分析有明显改进作用,并在 8 种形态丰富的语言中的实证分析表明,该估计方法通常比粗到 - 基于字符级神经网络的 SUMMA 项目跨语言媒体监测翻译
通过使用序列到序列的神经翻译模型的低维语义表示能力,该论文尝试解决自动多语种新闻监测中出现的两个问题:将电视和广播节目 ASR 转录分割成单个故事,对来自各种来源和语言的单个故事进行故事线聚类。为了实现多语种神经翻译的联合多任务学习,论文使 - ACL基于字符的神经机器翻译
本研究旨在解决神经机器翻译应用于大词汇量和形态丰富语言的挑战,通过使用基于字符的嵌入法,结合卷积层和高速公路网络来替代传统的基于词的表示法,并测试其在注意力机制双向递归神经网络中的应用,结果表明该方法即使在源语言不富含形态学的情况下也能够在 - ACL使用字符序列到序列学习生成形态变化
本研究提出了一种基于神经编码器解码器模型的方法,用于生成 Morphological inflection generation 任务中给定基本形式的词汇对应的特定语言变换的变形形式,并在 7 个形态丰富语言的数据集上进行评估,获得了与现有 - 在形式中寻找功能:用组合字符模型表示开放词汇
提出了一种使用双向 LSTMs 将字符组合成词向量表示的模型,相对于传统的独立词向量模型,我们的模型仅需要每个字符类型一个向量和一个固定的组成模型参数,使用此模型的 “组合” 单词表示在语言建模和词性标注方面表现出最先进的结果,特别是在形态 - EMNLP利用 LSTM 对字符而非单词建模以提升转移式句法分析
本文介绍了一种针对形态丰富的语言的连续状态依赖解析扩展方法,使用 LSTM 循环神经网络来学习表示解析器状态,将基于查找的词表示替换为由单词的正字表示构成的表示,使用字符编码来提高解析模型的表现。