Sep, 2023

DiariST: 带有说话者分离的流式语音译文

TL;DR该论文提出了 DiariST,第一个基于神经传感器的流式语音翻译和说话人分离解决方案,它集成了用于多说话人语音识别的标记级别序列化输出训练和 t 向量,通过新的评估数据集 DiariST-AliMeeting 和新的衡量 ST 质量的度量方法,实现了较强的 ST 和 SD 能力,并为此推出了离线基线系统和评估代码。