Jun, 2024
RNN-T 语音识别模型在 GPU 上的光速准确贪婪解码
Speed of Light Exact Greedy Decoding for RNN-T Speech Recognition Models on GPU
Daniel Galvez, Vladimir Bataev, Hainan Xu, Tim Kaldewey
TL;DR使用 CUDA 图形条件节点,优化了 RNN-T 模型的解码过程,将其速度提升 2.5 倍,同时可以应用于其他解码算法获得 1.7 倍至 1.4 倍的速度优化,使得高吞吐量推理中的 RNN-T 模型性能接近 CTC 模型。