Sep, 2022

深度学习中稀疏专家模型综述

TL;DR稀疏专家模型是一种在近三十年中不断涌现的深度学习架构,通过在每个样本中使用参数子集来实现稀疏度,使参数计数与每个样本的计算分离,产生非常大但高效的模型,已在自然语言处理、计算机视觉和语音识别等领域中显著提高性能。