Mar, 2024

Quiet-STaR: 语言模型能够自我教导在言语之前思考

TL;DR在这篇论文中,作者提出了一种新方法 Quiet-STaR,通过使语言模型能够生成每个标记的理由来解释未来的文本,以改进其预测能力,并在不需要对这些任务进行微调的情况下,在多个基准测试中取得了显著的改进。