Apr, 2024

MAD Speech:语音声音多样性的度量

TL;DR发展了一种声学多样性的轻量级度量标准集,通过专门的嵌入模型和一个聚合函数来衡量声学多样性,在多个真实评估场景中展示了其适用性。