Jun, 2024

有限制的教师监督下的解码需要理解何时信任教师

TL;DR发展一种能够有效聚合 sLLM 和 LLM 在初始度上的预测结果以便后续由 sLLM 生成的标记能更准确影响,通过对 sLLM 的置信度自适应性地超信任或忽略 LLM 的预测,我们证明我们的方法在各种模型和数据集上提供了一致的改进。