BriefGPT.xyz
Ask
alpha
关键词
audio compression
搜索结果 - 5
基于事件的自编码器的音频压缩技术
神经元通过称为脉冲的时机事件传递信息,在数字系统中如何利用这一信息仍不清楚。在本研究中,我们展示了事件编码在音频压缩中的有效性。我们使用深度二进制自编码器构建了这种基于事件的表示,在高稀疏度压力下,模型进入了二进制事件矩阵通过稀疏矩阵存储算
→
PDF
5 months ago
具有零射击数据压缩的边缘存储管理配方用于路面异常检测
提出了一种基于预训练自编码器的数据压缩方法,旨在提高边缘计算中基于音频的道路异常检测系统的存储和传输效率。经过对比实验,确认零样本音频压缩具有高度保留异常检测性能的同时,提升了存储和传输效率。
PDF
a year ago
ICML
Siamese SIREN:使用隐式神经表示的音频压缩
该研究介绍了一种新的基于 SIREN 架构的方法 ——Siamese SIREN。实验结果表明,与其他 INR 架构相比,Siamese SIREN 在利用更少的网络参数的情况下可以实现较高的音频重建保真度。
PDF
a year ago
改进 RVQGAN 实现高保真音频压缩
介绍了一种高保真度的神经网络通用音频压缩算法,它结合了高保真度音频生成的进展以及图像领域的更好的向量量化技术,并使用改进的对抗和重构损失将高维自然信号压缩成较低维度的离散令牌,该算法可以通过单一的通用模型压缩所有领域(语音、音乐等)的信号。
PDF
a year ago
MP3net: 用简单的卷积 GAN 从原始音频中生成连贯分钟级音乐
本文提出了一种基于卷积神经网络的生成对抗网络,应用了音频压缩和 MDCT 数据表示等技术生成长时间和高质量的音频样本,并利用人耳的听觉掩蔽效应和心理声学感知限制来拓宽真实分布并稳定训练过程。经过 250 小时的训练,使用单个 Cloud T
→
PDF
3 years ago
Prev
Next