Feb, 2023

语音基础模型的高效领域自适应

TL;DR本论文采用自监督预训练方法 BEST-RQ,并使用 JUST Hydra 进行源域和无监督目标域数据的联合微调,将 FM 编码器适配器和解码器微调到目标域,使用少量带标记的域内数据,实现了在大规模 YouTube 和语音搜索任务中既数据又模型参数的高效性,在仅使用 2160 万个带标签的域内数据和 130.8 M 的微调参数的情况下,与另外 3 亿带标签的域内数据从头训练 731.1M 模型的效果相同。