Apr, 2022

利用最近邻对比学习生成语音序列嵌入

TL;DR我们介绍了一个基于自监督的音频表示的简单神经编码器架构,该架构可以使用无监督对比学习目标进行训练,并通过 k - 最近邻搜索获得它的正样本,从而可以在多个语言中应用,可用于随机语音序列的按示例查询和口头术语的发现,实验证明该方法在五种语言上显著推动了技术发展,并建立了一个基准测试以便未来监测领域的进展。