Nov, 2023

注意力还是卷积:用于推理效率的音频语言模型中的Transformer编码器

TL;DR通过本文研究发现,使用简单的自监督预训练音频模型能够实现与复杂的预训练模型相媲美的推理效率,同时采用自注意力模块与卷积模块相结合的语音转换器能够在ASR上取得最先进的性能表现,同时使用较低位权重量化技术的神经网络的简单方法,能够提高效率并防止在量化模块之间传播误差。