Jun, 2024

从解码到元生成:大型语言模型的推理时间算法

TL;DR通过对大型语言模型的研究,发现在训练过程中提高计算能力可以取得更好的结果,然而对于推断阶段提高计算能力的好处却没有得到足够的关注。本文调查了推断阶段的几种方法,包括基于令牌级别的生成算法、元生成算法和高效生成方法,并从传统自然语言处理、现代大型语言模型和机器学习系统的角度统一了观点。