Jul, 2024

证明-验证游戏提高LLM输出的可读性

TL;DR通过使用可读性逐渐训练小验证器以提高大型语言模型(LLMs)的可读性和输出,以便在解决小学数学问题时提供清晰且易于检查的推理,这是一种增加对LLMs输出的信心的方法。