基于显著特征的水声信号识别

Dec, 2023

Underwater Acoustic Signal Recognition Based on Salient Features

Minghao Chen

TL;DR本文提出了一种利用神经网络进行水声信号识别的方法，通过从频谱中提取特征，利用深度学习模型不断学习抽象特征并调整权重，以提高分类性能。

Abstract

With the rapid advancement of technology, the recognition of underwater acoustic signals in complex environments has become increasingly crucial. Currently, mainstream underwater acoustic signal recognition relies primarily on time-frequency analysis to extract →

underwater acoustic signals spectral features time-frequency analysis expert systems deep learning

发现论文，激发创造

跨领域声音识别用于高效水下数据分析

本论文提出了一种新颖的深度学习方法，通过利用在广泛范围的非水下（空中）声音上训练的模型分析海量水下声音数据。我们通过主成分分析和 UMAP 可视化方法，在二维空间中对水下数据进行了聚类，并选择候选标签进行进一步训练。其次，我们使用选定的水下数据和非水下数据集训练了一个神经网络模型，并量化分析了模型对于识别空气枪声，一种常见的水下声音，的准确率、召回率和 F1 得分。我们的模型达到了超过 84.3% 的 F1 得分，证明了我们的方法在分析水下声学数据方面的有效性。该论文提出的方法在减少水下数据分析所需的工作量方面具有重要潜力，为跨领域数据分析的进一步研究开辟了新的可能性。

Sep, 2023

基于光滑感应正则化和基于频谱图的数据增强的水声目标识别

本研究提出在数据量有限的情况下，采用平滑性正则化，即只在正则项中加入模拟信号，并使用专门的光谱图基础数据增强策略（LMR），以避免性能下降的风险来增强模型的泛化能力。实验证明了该方法具有优越性。

Jun, 2023

水下艺术：利用文本模板拓展水声目标识别的信息视角

我们提出了一种基于丰富相关信息模板的水下声学识别方法（称为 UART），其采用音频 - 频谱图 - 文本三模态对比度学习框架，通过自然语言描述引导声学表征的学习，在实践中具有更好的识别能力和泛化性能，并且预先训练的 UART 模型可以在没有任何辅助注释的情况下为识别模型提供卓越的先验知识。

May, 2023

通过自适应数据修剪和平滑 - 引导正则化对水下声纳目标识别的改进

本研究针对数据采集困难的问题，对基于水声识别的船舶辐射信号进行数据整合，采用交叉熵策略和 KL 散度的光滑度约束正则化方法来补充并优化训练数据，实验证明，该方法在低资源场景下能显著提升模型表现。

Apr, 2023

可学习细粒度小波变换的自适应船舶辐射噪声识别

本文提出了一个自适应广义识别系统 - AGNet（自适应广义网络），用于分析海洋声学环境中的船舶辐射噪声识别。通过将固定的小波参数转化为可学习的精细参数，AGNet 学习了不同频率下的水下声音特征，并采用卷积神经网络并行卷积注意力模块作为分类器。实验表明，AGNet 在几个水下声学数据集上胜过所有基线方法，而且对于各种干扰因素表现出鲁棒性。

May, 2023

基于人类评分系统和人工神经网络的大型生物声学信号分类

本文提出一种方法，通过结合来自时频谱图的信号特征和人类感知，以提高声音分类性能，该方法利用人工神经网络 (ANN) 学习基于人类感知知识的信号特征，并应用于包含 24 个月几乎连续记录的大型声学数据集，结果表明性能显著提高。

May, 2013

改进合成训练的声纳图像描述符在水下地点识别中的泛化性能

自主导航与水下环境中的挑战，主要包括光吸收和水浑浊度等因素，传统视觉算法对声纳生成的声学图像的应用效果较差，而卷积神经网络通常需要大量的标记训练数据，这些数据通常难以获取。因此，我们提出了一种新型的紧凑型深度声纳描述符管道，它能够在仅仅用于合成数据的情况下推广到真实场景，并通过标准的临时规范化 / 预滤波技术提升输入声纳数据的质量。同时，我们还介绍了自定义的合成数据生成过程。通过对合成和公开可用的真实数据的广泛评估，证明了我们提出的方法相较于最先进的方法更加有效。

Aug, 2023

工业机器故障诊断的深度神经网络声音信号分析

设计了基于深度学习的系统来分析工业机器产生的声音信号，将声音信号转换为 Mel 频谱图，并使用 DenseNet-169 模型对谱图图像进行分类，结果表明该方法在不同的声音噪声比水平下实验得到了 97.17% 到 99.87% 的准确率。

Dec, 2023

使用条件卷积神经网络进行水声传输损耗的持续学习

为了准确预测船只远场噪声，本研究提出了一种融合海底地形数据的新型条件卷积神经网络，通过将该架构整合到持续学习框架中，希望将模型推广到全球各地海底地形的不同情况。该架构能够有效捕捉变化的海底地形下的传输损耗，可集成到水下辐射噪声的自适应管理系统中，提供近场船只噪声源与海洋哺乳动物所在位置接收到的噪声之间的实时端到端映射。

Apr, 2024

音频信号处理的深度学习

该研究文章综述了当前音频信号处理领域中基于深度学习的技术，着重介绍了其在语音、音乐、环境声音处理中的相同点和差异，强调了其潜在的交叉互补性。文章介绍了主要的特征表示和深度学习模型，以及其在音频识别和合成分离领域的应用，并最终确定了深度学习在音频信号处理中的关键问题和未来研究方向。

Apr, 2019