May, 2022

BabyBear:针对昂贵语言模型的廉价推理分流

TL;DRBabyBear 是一种自然语言处理的 CASCADING MODEL 框架,其中采用了 Inference Triage 策略,使得在分类等任务中,减少了计算成本,同时仍然可以达到较高精度。