Sep, 2023

思维链推理是一种策略改进算子

TL;DR通过思维链推理自主学习的大语言模型可以教会自己新技能,超越了依赖大量人工生成数据进行训练的能力。