COLINGFeb, 2024

鬣狗如何处理人类语音?使用 ConfHyena 进行语音识别和翻译

TL;DR借鉴 Hyena 模型进行改进,我们提出了 ConfHyena 模型,以减少长序列语音处理的计算时间并保持较高的质量表现。在英语的自动语音识别和从英语到 8 种目标语言的翻译实验中,我们的 ConfHyena 模型在训练时间上节约了 27%,同时在质量下降方面仅为 1%,大多数情况下这种下降不具备统计学意义。