半结构化数学推理的策略梯度动态提示学习

ICLRSep, 2022

半结构化数学推理的策略梯度动态提示学习

Dynamic Prompt Learning via Policy Gradient for Semi-structured Mathematical Reasoning

Pan Lu, Liang Qiu, Kai-Wei Chang, Ying Nian Wu, Song-Chun Zhu...

TL;DR本研究介绍了一个新的数据集 TabMWP，其中包含需要在文本和表格数据上进行数学推理的问题，以及新的方法 PromptPG，使用策略梯度从少量训练数据中选择上下文示例并构造相应的提示，以优化大型语言模型在此类复杂数学推理问题上的表现。该方法提高了 5.31％的准确性，并显着减少了预测差异，验证了其在选择上下文示例方面的有效性。

Abstract

mathematical reasoning, a core ability of human intelligence, presents unique challenges for machines in abstract thinking and logical reasoning. Recent large pre-trained language models such as GPT-3 have achiev

mathematical reasoning pre-trained language models tabular data multi-step reasoning process policy gradient

发现论文，激发创造

大型语言模型中的符号数学问题推理

该论文研究了大型语言模型在数学问题推理方面的能力，特别关注符号推理在数值问题中的准确性，并通过自提示的方法提高了符号准确性，为模型提供了简洁可验证的推理能力。

Aug, 2023

利用训练数据进行少样本提示数值推理

采用动态程序提示和程序蒸馏两种方法，使用大型语言模型中的训练数据来改进数学问题解决中的提示，并在三个标准数学问题数据集上得到了显着的结果。

May, 2023

走向可行的数学推理：解决数学应用题的挑战、策略和机遇

研究了解决自然语言描述的数学问题的非神经和神经方法，并突出了这些方法具有可泛化、数学合理、可解释和可解释的能力，提出使用外部知识和知识渗透学习的需求和机会。

Oct, 2021

半结构化表格问答的神经多步推理

本文研究使用深度学习技术回答多步推理问题的方法，该方法基于自然语言问句生成机器可理解的逻辑形式，使用字符和单词 CNN 同时嵌入逻辑形式和问句，并使用神经评分函数检索问题的最可能逻辑形式，取得 38.7% 的最佳性能。

Feb, 2017

深思熟虑：问题拓展引导提升大型语言模型的数学推理能力

使用 Problem Elaboration Prompting（PEP）改善大型语言模型（LLMs）的数学能力，在复杂推理和问题背景理解方面取得了有希望的表现。

Feb, 2024

从半结构化表格中生成样例，赋予语言模型推理技能

本文提出了一种基于预训练的方法，通过利用半结构化表格自动生成问题 - 段落对，以检验模型的推理能力，并且通过采样策略来提高模型训练的效率，在三个涉及推理的阅读理解数据集上证明了我们的模型相比于现有流行模型 T5 表现更优。

Jul, 2021

MathPrompter：利用大型语言模型进行数学推理

提出了一种名为 MathPrompter 的技术，它使用 Zero-shot chain-of-thought 提示技术生成多个代数表达式或 Python 函数，并以不同的方式解决相同的数学问题，从而提高模型在算术问题上的性能并提高置信水平。

Mar, 2023

问题分析提示提高推理任务中的 LLM 性能

尽管 LLMs 在许多领域具有潜力，但在推理任务上仍不如人类表现出色。本研究探讨了一个问题：让 LLM 分析问题是否能提高其性能？我们提出了一种新颖的提示策略，称为问题分析提示 (QAP)，模型在解决问题之前被提示用 $n$ 个词解释问题。值 $n$ 影响模型生成的回答长度。在算术数据集 GSM8K、AQuA、SAT 和常识数据集 StrategyQA 上评估了 QAP 在 GPT 3.5 Turbo 和 GPT 4 Turbo 上的表现。QAP 与其他领先的提示方法，包括思维链提示 (CoT)、计划与解决提示 (PS+) 和深呼吸提示 (TADB) 进行了比较。在 AQuA 和 SAT 数据集上，QAP 在 GPT 3.5 和 GPT 4 上的表现超过了所有的领先提示方法。在 75% 的测试中，QAP 始终排名前 2 位。QAP 表现的一个关键因素是回答长度，详细的回答对回答更难的问题有益，但可能对简单问题产生负面影响。

Jul, 2024

基于常识知识图谱和方程式的数学应用题生成

本研究提出了一种通过神经网络模型从常识知识图谱和方程式中生成多样化数学单词问题的方法，并在教育评估方面表现出优越性，其中自规划模块实现了方程和常识知识信息的自动融合。

Oct, 2020

JiuZhang3.0：通过训练小型数据合成模型高效提升数学推理能力

基于 GPT-4 的数据合成能力，我们提出了一种通过训练小型语言模型来合成数学问题，以高效生成足够高质量的预训练数据的有效方法，并在数学推理数据集上展现了最先进的性能。

May, 2024