Jun, 2024

优化偏好链:改进 LLMs 中的思维链推理

TL;DR通过 fine-tuning LLMs,利用 tree-of-thought 方法构建的搜索树,实现了链式思考解码 (CoT) 在复杂问题求解中取得类似或更好性能的成果,避免了大量的推理负担。