BriefGPT.xyz
Ask
alpha
关键词
noisy conditions
搜索结果 - 3
Whisper-Flamingo: 集成视觉特征于 Whisper 中用于音频 - 视觉语音识别和翻译
Audio-Visual Speech Recognition (AVSR) uses Whisper-Flamingo, a model that integrates visual features, to improve speech
→
PDF
22 days ago
为什么角边缘损失对半监督异常声音检测很有效?
通过实验证明,最小化角度边缘损失还可以最小化紧凑性损失,从而避免学习平凡的解决方案,同时还能教会模型适用于在嘈杂条件下检测异常声音的表示方法。
PDF
9 months ago
基于神经网络剪枝的迭代微调设计紧凑型视听唤醒词识别系统研究
本文提出了一种使用神经网络剪枝策略的紧凑型音视频唤醒词识别系统,该系统利用 MobileNet 对唇部信息进行编码,并与声学特征进行融合,大大提高了在不同噪声条件下的唤醒词识别性能,可望在电视开机场景下实现实际应用。
PDF
2 years ago
Prev
Next