Jun, 2024

基于 Transformer 的 ASR 表示中性别的编码

TL;DR使用线性消除的方法,本研究探讨了两个基于 transformer 的 ASR 模型 ——Wav2Vec2 和 HuBERT 中性别信息的编码和利用,并证明了从 ASR 模型的每一层中移除性别信息的可行性。此外,分析表明最终层中的第一帧和最后一帧存在大量的性别信息,解释了在这些层中消除性别的容易度。研究结果表明可以创建性别中性的嵌入,并将其整合到 ASR 框架中而不影响其效果。