Mar, 2023

大型语言模型的自动多步推理和工具使用

TL;DRART 框架使用冻结的 LLM 自动生成中间推理步骤作为程序,并能无缝集成生成和外部工具使用,使得在 BigBench 和 MMLU 基准测试中,通过自动 CoT 和 few-shot 提示,ART 实现了对未知任务的实质性改进。在选定的任务上,人们可以通过纠正特定的程序错误或整合新工具来改善 ART 的性能.