May, 2022
分离 - 转换 - 分段器:多方语音的流式识别和分割
Separator-Transducer-Segmenter: Streaming Recognition and Segmentation of Multi-party Speech
Ilya Sklyar, Anna Piunova, Christian Osendorfer
TL;DR提出了一种基于神经网络的新方法 ——STS,包括一种新的分割建模策略和一种新的发射规则方法 FastEmit 等,用于多方会谈的流媒体识别和分割。