- 预训练特征引导扩散模型用于语音增强
通过整合频谱特征到变分自编码器(VAE)中,并在反向过程中利用预训练特征进行引导,结合确定性离散积分方法(DDIM)来简化抽样步骤,我们的模型提高了效率和语音增强质量,同时在两个不同信噪比的公共数据集上展示出最先进的结果,超越了其他基线方法 - HSIMamba: 高效特征学习与双向状态空间的高光谱成像分类
通过使用双向反卷积神经网络路径提取光谱特征的 HSIMamba,进一步结合具有 Transformer 中的注意机制的动态特征提取能力,避免了高计算要求。该方法在处理数据的双向性上有显著优势,大幅度提取光谱特征并将其与空间信息综合分析,从而 - 多重分形 - 谱特征增强异常扩散分类
多重分形光谱特征在增强异常扩散分类中表现出多样而强效的作用。
- 利用人类视觉探索高光谱异常检测:一种针对小目标的感知器
本文分析了人类视觉感知下的高光谱影像特征,并首次将异常检测 (HAD) 的解决过程转移到了更稳健的特征空间。我们提出了一种小目标感知检测器 (STAD),它引入了显著性图来捕捉更接近人类视觉感知的高光谱影像特征。此外,我们还提出了一种全连接 - 基于显著特征的水声信号识别
本文提出了一种利用神经网络进行水声信号识别的方法,通过从频谱中提取特征,利用深度学习模型不断学习抽象特征并调整权重,以提高分类性能。
- Rayleigh 商图神经网络用于图层级异常检测
我们提出了 Rayleigh Quotient Graph Neural Network (RQGNN),这是第一个用于图级异常检测的谱 GNN,通过探索异常图的固有谱特征,显著提高了性能。
- X 射线显微光谱中材料化学状态的稳健检索
提出了一种新的 X 射线显微光谱数据表达模型及专用反混合框架,可可靠地检索材料的化学状态,即使在信噪比低和重叠光谱特征等挑战条件下,也能准确识别复杂和异质样品中的化学状态。
- 基于谱特征的图分类高斯过程
本文提出根据图的结构和节点属性对其进行分类的方法,使用图信号处理中的频谱特征派生两种高斯过程模型进行图分类 —— 第一种,基于图谱频谱能量信号分布的频谱特征;第二种,旨在捕捉图中多尺度和局部的模式,通过学习谱图小波滤波器来获得更好的性能。最 - MOS 预测系统中语音表示的比较
本研究比较了自监督学习特征和谱特征的性能,并结合了两者以提高自动 MOS 的准确性。使用大规模听力测试语料库,发现 wav2vec 特征具有最佳的泛化能力,且结合特征组合表现最佳。
- 可学习非线性压缩用于稳健扬声器验证
本研究基于深度神经网络,针对演讲者验证中的非线性压缩方法在光谱特征中的应用进行了探究,并提出了一种多区域设计的非线性压缩方法,通过实验证明与常用的对数方法相比,在 VoxCeleb1 和 VoxMovies 数据集上,基于功率函数的压缩方法 - MM应用恒 Q 变换的非线性频率扭曲在语音情感识别中的应用
本文探讨了基于 constant-Q 转换(CQT)的短时语音情感识别(SER),使用 CQT 的低频分辨率优于标准短时傅里叶变换(STFT)的高频分辨率,经过比较分析,使用深度神经网络(DNN)作为后端分类器对基于 STFT 和 CQT - 一种用于非刚性形状匹配的双重迭代细化方法
本研究提出了一种基于双重迭代精化(DIR)的解决方案,通过优雅的方法将空间和频谱数据融合起来,从当前迭代中提取更多准确的信息用于下一次迭代,有效地将双重信息结合在一起,从而提供了一种高效而稳健的密集对应解决方案。
- 使用深度自回归神经网络进行歌声合成的声学建模
本文提出了使用自回归神经网络对歌声合成进行声学建模的方法,以更好地描述连续帧音频特征之间的依赖关系。实验结果表明,使用自回归模型的方法可以更有效地产生包含颤音的 F0 轮廓,并且可以比使用递归神经网络的传统方法实现更好的客观和主观性能。
- WWW频谱增强的成对学习排序
通过使用超图结构的波谱特征来模拟用户的偏好和商品的特性,并将其结合到矩阵分解模型中来增强推荐系统的性能,并且使用波谱特征来优化贝叶斯个性化排序,以丰富用于无显示反馈数据中的正样本。
- 基于变分自编码器的跨域特征语音转换
本文为了更好地用变分自编码器 (VAE) 进行语音转化,提出了一种名为 CDVAE 的新颖框架,该框架将多种光谱特征(如 STRAIGHT 光谱和 MCC)用于无监督学习,实现了对编码器和解码器行为的设计。结果显示,该框架在主观测试中的表现 - 深度卷积神经网络用于脑电解码的谱特征的层级内部表示
本文通过研究 ConvNets 在 EEG 信号解码中的表现,发现其通过一系列层次逐渐学会了如何识别 EEG 信号的不同特征,其中后期的卷积层可以识别 EEG 信号的复杂特征,这为理解 EEG 时间序列的组合结构提供了洞见。
- 用于三维点云语义标记的全卷积网络
本文介绍了使用一维全卷积网络对点云数据进行语义标记的方法,该方法直接分析经过地形归一化后的点,并结合光谱数据以学习上下文特征。我们的方法不需要手动提取特征,且在多个方面上比传统方法表现更优越,其中包括利用 ISPRS 3D 语义标注竞赛数据