Apr, 2024

后语义思维:从大规模语言模型中提炼推理能力的强大策略

TL;DR通过链式思维微调策略,我们提出了一种强大的后语义思考策略 (Post-Semantic-Thinking, PST),旨在通过在表达方式上不受限制地生成答案,使得小型学生模型能够更好地理解基于语义推理的逻辑。广泛的实验在 12 个推理任务上证明了 PST 的有效性。