BriefGPT.xyz
Ask
alpha
关键词
acoustic event detection
搜索结果 - 5
基于深度学习的多模态方法的全面音视频分析工具链(骚乱或暴力背景检测的一个使用案例)
综合音视频分析工具链利用深度学习与多模态方法,完成语音转文字、声学场景分类、声学事件检测、视觉物体检测、图像字幕以及视频字幕等多个特定任务,并将其整合到工具链中,以提供各种基于音视频的应用,包括音视频聚类、综合音视频摘要以及骚乱或暴力场景检
→
PDF
2 months ago
自我中心视听噪声抑制
该论文研究了对自我中心视角视频的音频 - 视觉抑制,发现视觉信息有助于噪声抑制,提出了多任务学习框架来同时优化音频 - 视觉噪声抑制和基于视频的声音事件检测,并表明该模型在不同的噪声类型和信噪比下均比传统的音频模型更具有优势。
PDF
2 years ago
大规模音频分类的 CNN 结构
本文介绍了使用几种不同的卷积神经网络对音频进行分类,发现在大型数据集上运用图像分类中的卷积神经网络架构对于音频分类也十分有效,使用嵌入分类器的模型对音频事件检测的任务表现优于对原始特征的直接使用。
PDF
8 years ago
使用弱标签数据进行音频事件检测
本文提出使用弱标签数据学习声音事件检测器的框架,并给出两个基于支持向量机和神经网络解决多实例学习的方法,有助于提高数据处理效率和实现完整音频记录描述。
PDF
8 years ago
使用深度卷积神经网络和数据增强进行声学事件检测
本研究提出了一种新的声音事件检测方法,使用卷积神经网络结合大的输入层来提取长时频结构特征,同时采用数据增强方法防止过拟合,实验表明该方法在声音事件检测上表现优异,超过了现有方法,取得了 16% 的绝对提升。
PDF
8 years ago
Prev
Next