BriefGPT.xyz
Nov, 2022
神经傅里叶平移在双耳朵渲染中的应用
Neural Fourier Shift for Binaural Speech Rendering
HTML
PDF
Jin Woo Lee, Kyogu Lee
TL;DR
本文提出了一种基于神经傅里叶移位的新型神经网络结构,名为NFS,该结构能够在傅里叶空间中实现双耳语音合成,其通过预测早期反射的延迟和尺度来实现。该方法在内存和计算成本上都非常有效,且能够独立于源领域进行操作,实验结果表明其在性能和效率上优于以往的类似研究。
Abstract
We present a
neural network
for rendering
binaural speech
from given monaural audio, position, and orientation of the source. Most of the previous works have focused on synthesizing binaural speeches by condition
→