Jun, 2024

航空交通管制中的联合与顺序发言者 - 角色检测及自动语音识别

TL;DR利用空中交通管制数据进行自然语言处理需要进行预处理步骤,我们提出了一种基于 Transformer 的联合语音识别(ASR)和说话人分离(SRD)系统,比较了该系统与传统方法在多个 ATC 数据集上的性能,研究显示了何种情况下该联合系统能够胜过传统方法以及何种情况下其他架构更可取,同时我们评估了声学和词汇差异对所有架构的影响并展示了如何克服它们。