ICLRJul, 2020

声学邻居嵌入

TL;DR本文提出一种新颖的声学单词嵌入,名为声学邻域嵌入,其中利用随机邻近嵌入(SNE)将任意长度的语音或文本映射到固定的、降维的向量空间中。通过训练两个编码器神经网络,它在神经网络训练中具有更有效的梯度,并在单词(名称)识别任务中显著提高了准确性,特别是在使用新的嵌入向量之间的欧几里德距离进行孤立名称识别任务时。