关键词chain-of-thought prompt
搜索结果 - 2
- 通过潜变量推断训练思维链
大型语言模型通过使用 ``思维链 '' 提示以逐步解决问题的方式更准确地解释,一种监督微调的方法是通过使用可调参数的梯度上升来最大化标记训练集中正确答案的平均对数似然。然而,我们提出了一种微调策略,尝试通过使用思维链提示最大化生成正确答案的 - ACT-SQL: 上下文学习的自动生成思维链文本到 SQL
我们研究了在文本到 SQL 任务中的提示设计问题,并尝试提高大型语言模型在生成 SQL 查询时的推理能力。我们设计了一种类似于模式链接的思维链 (CoT) 提示的方法,并提供了一种名为 ACT-SQL 的方法来自动生成自动 CoT 示例,从