Mar, 2023
I3D:带有输入依赖的动态深度的 Transformer 架构用于语音识别
I3D: Transformer architectures with input-dependent dynamic depth for speech recognition
Yifan Peng, Jaesong Lee, Shinji Watanabe
TL;DR该研究提出了一种新的 Transformer 编码器模型,并利用输入依赖动态深度 (I3D) 实现了性能 - 效率的良好均衡,该方法可用于压缩模型大小并通过迭代层剪枝处理以提高模型性能,同时对门控概率和输入依赖性进行了分析以更好地理解深度编码器。