ACLJul, 2021

一种灵活的 BERT 多任务模型服务

TL;DR本文提出一种基于 BERT 的多任务框架,采用部分微调,单任务模型知识蒸馏和模型压缩技术,使得各个子任务的共享部分得以共用,从而实现了低成本、高性能的实时任务处理。该框架在小米智能语音助手中得到了应用,整个系统处理成本降低了 86%。