Jul, 2024

强化Whisper作为多人对话和目标对话说话识别系统

TL;DR本研究提出了一种创新的方法来增强Whisper,它是一种语音基础模型,以应对联合多说话人和目标说话人语音识别任务。该方法在两种识别任务上优于先前的方法,并在AishellMix普通话数据集上实现了可接受的零热身性能。