multi-talker | BriefGPT - AI 论文速递

关键词multi-talker

搜索结果 - 4

多说话人重叠语音识别的演讲者掩蔽变换器
该研究论文提出了一种新的模型，结合语音识别和说话人分离的任务，通过引入说话人标签和说话人掩码分支，实现了多说话人重叠语音的识别和说话人分离。实验证明了该方法在复杂的多说话人场景中有效地提高了说话人分离的准确性。
PDF7 months ago
使用旁路分离器进行多说话人重叠语音识别和说话人分离的统一建模
通过在单输出识别（ASR）模型中插入侧耳声分离器，结合说话人分离（diarization）任务，提出了一种能够同时定位多个讲话者的多讲话人重叠语音识别语音模型。
PDFa year ago
基于深度递归神经网络的话语级别不变置换训练的多说话者语音分离
本文提出了逐句级别的置换不变训练（uPIT）技术，利用循环神经网络实现了多说话人语音分离，无需事先了解信号时长、说话人数量、身份和性别，且模型具有很好的泛化性能，在实验中表现优异。
PDF7 years ago
面向说话人不可知的多人语音分离的深度模型置换不变训练
本研究提出了一种新的深度学习模型，用于解决语音分离的 Cocktail-party 问题，它支持排列不变训练（PIT），实验表明 PIT 的有效性可以解决语音分离中的标签置换问题，从而实现自动会议记录和多方人机交互等的应用。
PDF8 years ago