Nov, 2023

心灵之镜:从大型语言模型中提炼自我评估能力和综合思考

TL;DR大型语言模型(LLMs)在自然语言处理领域取得了显著的进展,但是考虑到它们的规模和计算需求,将这些模型实际部署在资源受限的环境中面临着巨大的挑战。为了解决这些问题,我们提出了一种双重方法:首先,我们引入了一种将 LLMs 中固有的自我评价能力提取到 SLMs 中的新方法,旨在减少错误推理和幻觉的不利影响。其次,我们建议采用综合的蒸馏过程,结合多种不同的链式思维和自我评价范式,确保更全面、更稳健地将知识转移至 SLMs 中。在三个自然语言处理基准测试上进行的实验表明,我们的方法显著提高了蒸馏 SLMs 的性能,并为开发与人类认知更接近的较小模型指明了方向。