BriefGPT.xyz
Ask
alpha
关键词
target speaker extraction
搜索结果 - 3
在鸡尾酒会上输入以聆听:文本引导的目标说话人提取
通过结合自然语言处理,本研究提出了一种名为 LLM-TSE 的模型,可以提取用户输入的文本信息中的有用语义线索,辅助预注册线索或独立控制目标说话人提取过程。实验结果表明,当仅使用文本线索时,性能表现有竞争力,并且结合预注册声学线索时,创造了
→
PDF
9 months ago
MM
稀疏 LDA 转换的说话人嵌入在目标说话人提取中的应用
本文提出了一种基于简化说话人提示的目标说话人提取方法,通过在 SepFormer 模型中加入 X-vector、Xi-vector 和 LDA-transform 方法产生的新的说话人嵌入,显著提高了模型的性能。在 WSJ0-2mix 数据
→
PDF
a year ago
时域音视频语音分离
本文介绍了一种新的时间域音视图架构,用于从单声道混合物中提取目标说话人,实验结果表明,相比于仅有声音的 TasNet 和频域音 - 视网络,我们的方法在两个和三个说话人的情况下分别可以提供 3dB + 和 4dB + 的信噪比改进。
PDF
5 years ago
Prev
Next