BriefGPT.xyz
Oct, 2024
在代码执行与文本推理之间引导大型语言模型
Steering Large Language Models between Code Execution and Textual Reasoning
HTML
PDF
Yongchao Chen, Harsh Jhamtani, Srinagesh Sharma, Chuchu Fan, Chi Wang
TL;DR
本研究解决了当前大型语言模型在编写代码时缺乏最佳引导方法的问题,提出了三种方法改进代码与文本生成的引导。关键发现表明,模型在不同任务复杂度和规模下使用代码和文本推理的模式值得关注,且使用模型编写的代码并不总是优于文本推理。此研究为未来的研究方向提供了重要启示和改进空间。
Abstract
While a lot of recent research focuses on enhancing the
Textual Reasoning
capabilities of
Large Language Models
(LLMs) by optimizing the multi-agent framework or reasoning chains, several benchmark tasks can be s
→