Aug, 2020

自注意力编码与池化在说话人识别中的应用

TL;DR本文提出了 Tandem 自注意编码和池化(SAEP)机制来获取短语音说话人的辨别性 embedding,该方法利用了自注意力和位置编码,证明了该方法的有效性是比 ResNet-34,ResNet-50 和 x-vector 更高效的。