Jul, 2023

Conformer LLMs -- 卷积增强的大型语言模型

TL;DR本文将卷积层和 Transformer 这两个流行的神经网络块与大型语言模型(LLMs)进行整合。通过使用因果卷积滤波器和 Transformer 将潜在表示的局部和全局依赖相结合,取得了显著的性能提升。这项工作展示了一种强大的语音架构,可以在语言建模的大规模应用中进行整合和适应。