本教程介绍了一组称为 “神经机器翻译” 或 “神经序列到序列模型” 的新而强大的技术,这些技术已被用于处理人类语言的许多任务,并可成为任何想要建模某种形式的连续数据的人员工具箱中的强大工具。教程假定读者了解数学和编程的基础知识,但不假定具有神经网络或自然语言处理方面的任何特定经验。它试图解释所涵盖各种方法的直觉,然后具体讲解它们的数学细节,并以建议实现练习作为高潮,读者可以在实践中测试他们是否理解了内容。
Mar, 2017
我们提出一种递归编码器 - 解码器深度神经网络架构,直接将一种语言中的语音转换为另一种语言中的文本,通过多任务训练序列到序列的语音翻译和识别模型通过共享编码器网络来提高性能。
本文研究了基于具有副条件语言模型的生成的序列到序列翻译方法在不同类型任务中的适用性,包括有限词汇的 grapheme-to-phoneme 任务,并探讨了双向 LSTM 神经网络在这种方法中应用的优势。
May, 2015
该研究分析了一个基于注意力机制的序列到序列语音识别系统,提出了解决其预测过于自信和产生不完整转录的问题的实用解决方案,并在没有语言模型的情况下,其词错误率为 10.6%,与 trigram 语言模型一起达到了 6.7%的词错误率。
Dec, 2016
本文提出了一种基于深度神经网络(DNN)的序列学习方法,使用多层长短时记忆(LSTM)解码目标序列并展现了其在英法翻译任务中优于传统短语模型翻译的成果,同时还发现调整源语句中单词的顺序可以有利于优化问题的解决。
Sep, 2014
本文展示了使用通用 encoder-decoder Transformer 和标准解码方法可实现与专业领域特定设计模型同等效果的自动音乐转录方法,从而取消了任务特定架构的需求,简化了转录,为集中精力于数据集创建和标注而非模型设计提供了可能性。
Jul, 2021
该研究提出了一种基于注意力机制的端到端学习的序列到序列神经网络,能够直接将一种语言的语音翻译成另一种语言的语音,无需中间文本表示,该方法通过学习将语音谱图映射到目标语言的谱图,同时也演示了译后语音合成的能力。研究在两个西班牙语到英语的语音翻译数据集上进行了实验,证明了该方法在这个极具挑战的任务上的可行性。
Apr, 2019
本文介绍了一种基于递归神经网络的端到端,概率序列转换系统,该系统可以将任意输入序列转换为任意的有限离散输出序列,并在 TIMIT 语音语料库上提供了音素识别的实验结果。
Nov, 2012
本文应用神经机器翻译技术在阿拉伯语翻译任务中进行比较和预处理,并发现在处理适当的阿拉伯语脚本前,神经机器翻译和基于短语的翻译系统性能相近,但神经机器翻译在域外测试集上明显优于短语翻译系统,在实际应用中更具吸引力。
Jun, 2016
通过引入词汇翻译机制并使用多种词典学习算法来初始化这种机制,可以提高序列建模任务的系统化泛化能力。
Jun, 2021