Mar, 2022

SkillNet-NLU: 用于通用自然语言理解的稀疏激活模型

TL;DR本文提出 SkillNet-NLU 模型,将已有技能拼合起来学习新任务,与传统密集模型不同,SkillNet-NLU 只激活与目标任务相关的模型参数,采用稀疏激活预训练为 Natural Language Understanding 任务提供了性能显著的预测效果,甚至在新任务上也比其他强大的基线模型表现更好。