该研究针对数学领域中的推理、学习、应用规则等独特挑战,提出了一个数学问题套件的任务,用于测试和评估神经架构等系统的性能、能力和失效模式。通过生成数据并运用序列到序列的最强模型,可以从不同角度评估模型在数学问题解决和知识推广方面的能力。
Apr, 2019
本研究采用最新的深度神经网络训练方法,成功开发出了一种模型,可以学会在基本本体论推理的形式下有效地进行逻辑推理,进而可以应用于许多现实世界中的问题,并且在各项实验中表现出高度准确和生物学上的可行性。
Aug, 2018
本文回顾了近年来关于深度学习在数学领域的研究,认为当前即使是最先进的深度学习模型在面对简单的数学和算术任务时也表现出较大局限性。
Mar, 2023
当前人工智能的最新技术在语言方面非常出色,但在数学推理方面则相对不足。本文以数学家的思维方式为参考,建立在当前深度学习在直觉和习惯性行为等方面取得成功的基础上,指出其在推理和稳健性不确定性估计等方面仍存在重要缺陷。文中以信息论的观点探讨了什么样的数学陈述是有趣的,这可能为塑造高级数学家人工智能的未来工作提供指导。重点不是证明给定的定理,而是发现新奇的猜想。核心假设是,一个有用的定理组应更好地总结所有可证陈述的集合,例如通过具有较小的描述长度,同时在推导步骤的数量上接近许多可证陈述。
Mar, 2024
该论文提供了一项深度学习在定理证明中的全面调研,包括现有方法的综述、数据集和策略的详细总结、评估指标和最先进技术的性能分析,以及未来研究的挑战和发展方向的批判性讨论。该调研旨在成为深度学习在定理证明中的基础参考,促进这个迅速发展领域的进一步研究。
Apr, 2024
本文综述了大型语言模型在推理方面的最新研究,包括提高它们的推理能力的方法、评估它们的推理能力的基准和方法,以及这一领域之前研究的发现和意义,旨在激发有意义的讨论和未来的研究。
Dec, 2022
通过构建神经网络来执行算法计算的神经算法推理有可能将经典算法运用于以前被视为不可达的输入,从而有了转化性的潜力。
May, 2021
研究了解决自然语言描述的数学问题的非神经和神经方法,并突出了这些方法具有可泛化、数学合理、可解释和可解释的能力,提出使用外部知识和知识渗透学习的需求和机会。
Oct, 2021
本文提出了一种基于应用学习 (LeAp) 框架的方法,通过明确的知识学习和应用来增强现有模型的推理能力,并形成了一种将知识 “学习” 和 “应用” 有机结合的知识图谱,提高了推理过程的解释性以及问题理解和符号推理能力。
Feb, 2023
数学推理是评估人类智能基本认知能力的基石。该研究调查了大型语言模型在解决数学问题方面的真正进展、障碍、数学问题类型和相关数据集、解决数学问题的 LLM 技术范围、影响 LLMs 解决数学问题的因素和问题,并提供了这一快速发展领域中的现状、成就和未来挑战的整体观点。
Jan, 2024