May, 2023

有序和二进制说话人嵌入

TL;DR本研究提出了一种有序二进制嵌入方法,通过嵌入向量中的维度排序并通过 Bernoulli 抽样将排序向量转换为二进制代码,从而实现说话者识别等任务中层次聚类,减少存储空间和加快检索速度。在 VoxCeleb 和 CN-Celeb 数据集上的实验证明了这些优点。