Dec, 2023

通过联合建模主要和非主要发言者改善长篇语音识别

TL;DRASR 模型经常在转录长时间音频时出现长篇删除问题,本研究通过引入新的技术,在音频中同时建模不同组的演讲者和标准转录标记,减轻了长篇删除问题。