BriefGPT.xyz
Ask
alpha
关键词
log-mel spectrogram
搜索结果 - 3
Syn-Att:通过半监督的未知多类 CNN 集成进行合成音频归属
通过将语音转化为对数梅尔频谱图,利用半监督学习和集成方法来提高稳健性和泛化性,本文提出了一种将合成语音与生成器相关联的新策略,并在 IEEE SP Cup 2022 的 ICASSP 挑战中,准确率相较 Eval 2 提高了 12-13%,
→
PDF
10 months ago
WWW
使用正负框架掩码的对比学习用于音乐表示
本文提出了基于对比学习的音乐表示的新方法 PEMR,它具有正负帧层级掩码生成模块和用于获得关于正负音频片段相似性的对比学习目标,该方法与现有方法相比更有效地学习音乐的有效表示。
PDF
2 years ago
使用 ConvNets 进行口语语言识别
该研究论文研究了语言识别的问题,使用了基于注意力机制和神经网络的方法,使用频谱图像作为输入以及原始波形作为特征,对六种语言进行了分类,获得了高精度的结果。
PDF
5 years ago
Prev
Next