变分自编码器在环境声音感知中的成本敏感检测
比较自动环境声音识别算法在计算成本方面的表现,结果表明在一定的计算成本范围内,深度神经网络能够提供最好的声音分类准确性比率,而高斯混合模型可以以相对较小的成本提供合理的准确性,支持向量机则在准确性和计算成本之间做了妥协。
Jul, 2016
该研究旨在开发一种基于声学信号的无监督异常检测方法,提出了一种名为 HCVAE 的新方法,利用可用的分类层次知识来完善潜空间表示,提高异常检测性能,并在不同领域进行实证研究,其性能優于基线系统 15%的 AUC 得分。
Jun, 2022
该文介绍了一个基于深度卷积神经网络的音频分类框架,旨在实现自动驾驶汽车的改进环境感知,并证明了相对于现有的音频分类框架,该框架在自动驾驶汽车相关声音的情况下表现更好。
Sep, 2022
本研究借鉴于压缩感知技术提出了基于不确定性自编码器的无监督表示学习框架,利用低维投影作为自编码器的噪声隐含表示,并直接学习数据信号的压缩和恢复,这一模型统一了压缩感知、生成模型、降维方法等多种线性研究,所得的统计压缩感知结果比其他竞争方法平均提高 32%。
Dec, 2018
利用自监督对比技术和浅层 1D CNN 提取环境音频的显著特征,进一步使用规范相关分析(CCA)来融合来自给定音频的两种输入类型的表示,并证明融合的全局特征相对于单独的表示具有更强的鲁棒性。在 ESC-50 和 UrbanSound8K 上的评估表明,该技术能够提取环境声音的大部分特征,并分别在 ESC-50 和 UrbanSound8K 数据集上获得了 12.8%和 0.9%的改进。
Jul, 2022
本文探讨了如何使用变分贝叶斯和变分自编码器(VAEs)进行异常检测(AD)任务,提出了一个新的方法来处理具有层次结构的数据。该方法在经典机器学习基准测试和监测 CERN 大型强子对撞机(LHC)实验的触发系统等应用中表现出卓越的性能。
Oct, 2020
本文讨论了一种从海洋环境中的航空图像中进行弱监督动物检测的重建方法,该方法利用异常检测框架直接计算输入空间的度量,与特征嵌入方法相比具有更好的可解释性和异常定位能力,同时在处理嘈杂数据方面具有优势,提供了有价值的洞察力,推动了监测海洋生态系统并减缓人类活动对海洋动物的影响的发展。
Jul, 2023
本研究提出了 ProVE 框架,通过使用 Procedural (audio) Variational autoEncoder 来学习环境音的 Procedural Audio 模型,实现合成音效的更高逼真度,并通过可调参数保持对生成声音的控制,该框架包括两个阶段:音频类别表达和控制映射。通过对不同表面的脚步声效果的示例应用,实验结果表明,相对于传统的 Procedural Audio 模型和对抗生成网络方法,ProVE 模型在声音保真度上表现更好,从而成为声音设计工作流程的有效工具。
Mar, 2023
本研究提出了一种基于深度学习自编码器的未监督学习方法,结合了重构与密度计算的异常得分方法,成功地应用于医学影像的异常检测,并在 BraTS-2017 和 ISLES-2015 分割基准测试中表现出色。
Dec, 2018