Jun, 2018

使用关注力的无监督语音词语切分

TL;DR这篇研究是对注意力词分割的首次尝试,通过从语音信号中直接进行词分割,最终目标是在低资源的口头语言中自动识别词汇单位。该方法假定在 UL 语言中的记录与资源充足的语言中的翻译相配对。使用声学单元发现(AUD)将语音转换为伪音段序列,然后使用神经机器翻译模型产生的神经软对齐来分割语音。该研究使用班图语 Mboshi 作为实际的 UL,并与单语和双语基线进行比较,说明了注意力词分割在语言记录方面的潜力。