Jan, 2021
音频Transformer模型听到了什么? 探究语言交付及其结构的声学表示
What all do audio transformer models hear? Probing Acoustic
Representations for Language Delivery and its Structure
TL;DR通过比较Mockingjay和wave2vec2.0这两种音频转换模型、对其语言传递和结构特征、音频、流畅性和发音特征、文本表面、语法和语义特征的理解,最终发现语音编码中的音频转换模型在语音理解方面取得了很好的效果,类似于基于BERT的转换模型。