Feb, 2024

基于事件的自编码器的音频压缩技术

TL;DR神经元通过称为脉冲的时机事件传递信息,在数字系统中如何利用这一信息仍不清楚。在本研究中,我们展示了事件编码在音频压缩中的有效性。我们使用深度二进制自编码器构建了这种基于事件的表示,在高稀疏度压力下,模型进入了二进制事件矩阵通过稀疏矩阵存储算法更有效存储的状态。我们将其与向量量化自编码器在大规模 MAESTRO 钢琴录音数据集上进行了测试。我们的 “脉冲音乐压缩” 算法不仅在压缩 / 重构平衡上取得了有竞争力的结果,而且在稀疏状态下不需要监督训练,编码事件和钢琴按键击中之间的选择性和同步性得以出现。