Oct, 2023

DASA:面向说话人验证的难度感知语义增强

TL;DR通过围绕发音人嵌入空间中的语义方向对训练样本进行扰动,使用鲁棒性发音人嵌入来估计准确的协方差矩阵,并推导出了预期损失的闭式上界,该研究提出了一种新颖的难度感知的语义扩增方法,能够在几乎没有额外计算成本的情况下产生多样化的训练样本,取得了令人瞩目的性能改进。