Oct, 2017

使用 LSTM 进行说话者分离

TL;DR本文介绍一种基于 d-vectors 的说话者辨识方法,将 LSTM-based 的 d-vector audio embeddings 与非参数聚类相结合,实现了最新的说话者辨识系统,与传统 i-vector 系统相比,取得了更好的结果。