Jun, 2024

PI-Whisper:面向多样化和不断演化的说话人特征的自适应增量式语音识别框架

TL;DR通过边缘自动语音识别 (ASR)技术,本研究提出了 PI-Whisper 框架,以增强 ASR 的适应性、实现增量式处理和促进多元化使用者群体的公平性和公正性,并在状态 - of-the-art 的准确性下降为主的情况下,提高 13.7%的识别准确率。