Jun, 2024

Perceiver-Prompt: 強調可變的語者適應,用於中文失調語音識別

TL;DR通过引入 Perceiver-Prompt 方法,利用 P-Tuning 对 Whisper 大规模模型进行微调,并通过可训练的 Perceiver 从可变长度输入中生成固定长度的说话人提示,以提高对中国发音障碍语音的模型识别性能。我们的实验结果表明,Perceiver-Prompt 在中国发音障碍语音数据集中获得了持续的识别性能改善,CER 相对减少高达 13.04%。