Dec, 2023

基于可微分数字信号处理和光谱最优传输的无监督谐波参数估计

TL;DR神经音频信号处理中,通过使用基频调节来增强合成器性能,但是通过使用标准的音频重建损失函数联合训练基频估计器和合成器是一种挑战,从而依赖于外部的基频跟踪器。为了解决这个问题,我们提出使用受到最优传输理论启发的谱损失函数来最小化谱能量的位移。我们通过无监督的自编码任务在谐波信号上拟合谐波模板来验证这种方法。我们使用轻量级编码器共同估计基频和谐波的幅度,并使用可微的谐波合成器重构信号。这种方法为改善神经音频应用中的无监督参数估计提供了有前途的方向。