EMNLPOct, 2023

缓存我如果可以:一种在线的成本感知教师 - 学生框架,用于减少对大型语言模型的调用

TL;DR通过缓存以前的机器学习模型响应并在中小企业端训练一个本地经济型模型,我们提出了一种降低调用大型语言模型次数的框架,使用两个常见的商业任务(意图识别和情感分析)以及两个经济型学生(k-NN 分类器和多层感知器)来展现实验结果表明,除了稍微降低性能外,还可以获得显著的运营费用节约。