ICLRFeb, 2022
基于生成潜变量模型的语音对比基准测试
Benchmarking Generative Latent Variable Models for Speech
Jakob D. Havtorn, Lasse Borgholt, Søren Hauberg, Jes Frellsen, Lars Maaløe
TL;DR该研究发展了一种基于时间的语音 LVM 基准,并将其与实用模型进行了比较,结合使用度量标准以及潜在变量等进行定量的分析。同时,也探究了建立在多个潜在变量层次上的时钟 VAE 模型在提高语音生成表现中的应用。