BriefGPT.xyz
大模型
Ask
alpha
关键词
multichannel
搜索结果 - 3
STARSS23: 具有声音事件的时空注释的真实场景空间录音的音频 - 视觉数据集
本文提出了一个音频 - 视频声音事件本地化和检测(SELD)任务,它使用多通道音频和视频信息来估计目标声音事件的时间激活和 DOA。音频 - 视觉 SELD 系统可以使用来自麦克风阵列和音频 - 视觉对应的信号来检测和定位声音事件,并介绍了
→
PDF
a year ago
ICASSP 2022 多通道多方会议转录挑战赛的 Volcspeech 系统
本文介绍了我们在 ICASSP 2022 M2MeT 挑战中的参赛作品。对于 Track 1,我们提出多种方法来加强聚类式说话人分割系统以应对重叠语音;对于 Track 2,我们采用 Conformer 模型和神经前端模块来训练系统,实现多
→
PDF
2 years ago
利用 Noiselet 编码的多通道压缩感知 MRI
本文介绍噪声基编码方案应用于多通道 MRI 数据采集,采用数学理论设计噪声编码器优化传统编码器的测量矩阵与稀疏变换矩阵间的不一致性与 RIP,并在实验中证实其在提高图像恢复精度和加速因素方面的显著性。
PDF
10 years ago
Prev
Next