BriefGPT.xyz
Ask
alpha
关键词
cocktail party problem
搜索结果 - 4
单声道多说话人语音分离使用高效 Transformer 模型
鸡尾酒会问题是指从多个说话者的混合语音中分离或区分单个说话者变得困难的情境。本研究采用基于 Transformer 架构及其高效形式的语音分离模型,在 LibriMix 数据集上进行训练,该数据集包含多样的说话者语音。该模型能从混合音频输入
→
PDF
a year ago
AAAI
模拟鸡尾酒会效应的注意力网络干扰训练下负面环境调整
本研究提出一种新颖的关注网络 Tune-In,通过负面环境下的训练解决鸡尾酒会问题,其中学习了两个独立的空间,代表说话人知识和语音刺激,并通过交叉和双重注意机制协作地处理任务,并且在实验中表现出超越现有基准系统的口语分离性能。
PDF
3 years ago
WHAM!:将语音分离扩展至嘈杂环境
本文旨在通过创建由两个讲话人混合的音频和真实环境噪声样本组成的 WSJ0 嬉皮士环境混合(WHAM!)数据集,对 speech separation 的性能进行更加真实和具有挑战性的评估和基准测试。虽然随着噪声的增加隔离性能下降,但对于大多
→
PDF
5 years ago
NIPS
单通道音频源分离的相位相关性研究
研究阐述了利用神经可行性稀疏生成模型中保留声音频谱的相位信息,可以更好地分离音频中的人声与音乐,减少了分离出的音频中的伪声,同时取得了最先进的状态分离性能。
PDF
7 years ago
Prev
Next