BriefGPT.xyz
大模型
Ask
alpha
关键词
chain of preference optimization
搜索结果 - 1
优化偏好链:改进 LLMs 中的思维链推理
通过 fine-tuning LLMs,利用 tree-of-thought 方法构建的搜索树,实现了链式思考解码 (CoT) 在复杂问题求解中取得类似或更好性能的成果,避免了大量的推理负担。
PDF
21 days ago
Prev
Next