变分自编码器在环境声音感知中的成本敏感检测

NIPSDec, 2017

变分自编码器在环境声音感知中的成本敏感检测

Cost-sensitive detection with variational autoencoders for environmental acoustic sensing

Yunpeng Li, Ivan Kiskin, Davide Zilli, Marianne Sinka, Henry Chan...

TL;DR本文介绍了一种基于成本敏感的分类范式，通过选择分类器的超参数和变分自动编码器的结构来实现对假阳性率和假阴性率之间灵活控制，以检测使用简单嵌入式设备收集的声音数据集中蚊子的存在。

Abstract

environmental acoustic sensing involves the retrieval and processing of audio signals to better understand our surroundings. While large-scale acoustic data make manual analysis infeasible, they provide a suitable playground for machine learning approaches. Most existing →

environmental acoustic sensing machine learning cost-sensitive classification variational autoencoders mosquito detection

发现论文，激发创造

自动环境声音识别：性能与运算成本比较

比较自动环境声音识别算法在计算成本方面的表现，结果表明在一定的计算成本范围内，深度神经网络能够提供最好的声音分类准确性比率，而高斯混合模型可以以相对较小的成本提供合理的准确性，支持向量机则在准确性和计算成本之间做了妥协。

Jul, 2016

基于分层条件变分自编码器的声学异常检测

该研究旨在开发一种基于声学信号的无监督异常检测方法，提出了一种名为 HCVAE 的新方法，利用可用的分类层次知识来完善潜空间表示，提高异常检测性能，并在不同领域进行实证研究，其性能優于基线系统 15％的 AUC 得分。

Jun, 2022

基于深度学习音频分类的自动驾驶车辆环境感知改进

该文介绍了一个基于深度卷积神经网络的音频分类框架，旨在实现自动驾驶汽车的改进环境感知，并证明了相对于现有的音频分类框架，该框架在自动驾驶汽车相关声音的情况下表现更好。

Sep, 2022

不确定性自编码器：通过变分信息最大化学习压缩表示

本研究借鉴于压缩感知技术提出了基于不确定性自编码器的无监督表示学习框架，利用低维投影作为自编码器的噪声隐含表示，并直接学习数据信号的压缩和恢复，这一模型统一了压缩感知、生成模型、降维方法等多种线性研究，所得的统计压缩感知结果比其他竞争方法平均提高 32%。

Dec, 2018

对比环境声音表示学习

利用自监督对比技术和浅层 1D CNN 提取环境音频的显著特征，进一步使用规范相关分析（CCA）来融合来自给定音频的两种输入类型的表示，并证明融合的全局特征相对于单独的表示具有更强的鲁棒性。在 ESC-50 和 UrbanSound8K 上的评估表明，该技术能够提取环境声音的大部分特征，并分别在 ESC-50 和 UrbanSound8K 数据集上获得了 12.8％和 0.9％的改进。

Jul, 2022

深度音频嵌入解析鸟鸣

研究使用半监督学习方法通过深度学习和声学监测来掌握鸟类叫声和环境噪声的特征，以提高环境声学数据的分类精度和深入了解环境声学数据的潜在结构。

Aug, 2021

条件变分自编码器进行异常检测

本文探讨了如何使用变分贝叶斯和变分自编码器（VAEs）进行异常检测（AD）任务，提出了一个新的方法来处理具有层次结构的数据。该方法在经典机器学习基准测试和监测 CERN 大型强子对撞机（LHC）实验的触发系统等应用中表现出卓越的性能。

Oct, 2020

利用向量量化变分自编码器从遥感影像中进行弱监督海洋动物检测

本文讨论了一种从海洋环境中的航空图像中进行弱监督动物检测的重建方法，该方法利用异常检测框架直接计算输入空间的度量，与特征嵌入方法相比具有更好的可解释性和异常定位能力，同时在处理嘈杂数据方面具有优势，提供了有价值的洞察力，推动了监测海洋生态系统并减缓人类活动对海洋动物的影响的发展。

Jul, 2023

学习环境声音的程序化音频模型的通用框架

本研究提出了 ProVE 框架，通过使用 Procedural (audio) Variational autoEncoder 来学习环境音的 Procedural Audio 模型，实现合成音效的更高逼真度，并通过可调参数保持对生成声音的控制，该框架包括两个阶段：音频类别表达和控制映射。通过对不同表面的脚步声效果的示例应用，实验结果表明，相对于传统的 Procedural Audio 模型和对抗生成网络方法，ProVE 模型在声音保真度上表现更好，从而成为声音设计工作流程的有效工具。

Mar, 2023

用于非监督异常检测的上下文编码变分自编码器

本研究提出了一种基于深度学习自编码器的未监督学习方法，结合了重构与密度计算的异常得分方法，成功地应用于医学影像的异常检测，并在 BraTS-2017 和 ISLES-2015 分割基准测试中表现出色。

Dec, 2018