Sep, 2017

未书写的语言也需要关注!使用编码器 - 解码器模型进行单词发现

TL;DR本研究考察了神经网络在非书面语境下的词语发现任务中的应用,其中包括无监督和有限监督两种情形,结果表明在只有 5,157 个句子的情况下,使用编码器 - 解码器神经机器翻译系统进行训练可以检索出至少 27% 的词汇量。此外,我们的方法具有生成翻译对位的优势,这可用于创建双语词表。未来可以直接从语音输入中使用此方法。