Oct, 2020
MarbleNet:面向语音活动检测的深度 1D 时间 - 通道可分离卷积神经网络
MarbleNet: Deep 1D Time-Channel Separable Convolutional Neural Network for Voice Activity Detection
Fei Jia, Somshubra Majumdar, Boris Ginsburg
TL;DRMarbleNet 是一个端到端的神经网络,用于语音活动检测,并通过 1D 时域 - 频域可分离卷积、Batch Normalization 等结构,在参数成本较小的情况下,实现了与现有最先进 VAD 模型相当的性能。