Mar, 2023

I3D:带有输入依赖的动态深度的 Transformer 架构用于语音识别

TL;DR该研究提出了一种新的 Transformer 编码器模型,并利用输入依赖动态深度 (I3D) 实现了性能 - 效率的良好均衡,该方法可用于压缩模型大小并通过迭代层剪枝处理以提高模型性能,同时对门控概率和输入依赖性进行了分析以更好地理解深度编码器。