Nov, 2023

投机的对比解码

TL;DR通过对大型语言模型进行推测性对比解码,提高了生成质量的同时节省了计算资源。