数学、应用题、常识和人工智能

Jan, 2023

Mathematics, word problems, common sense, and artificial intelligence

Ernest Davis

TL;DR本文讨论了当前人工智能技术在解决结合基本知识和常识推理的词问题方面的能力和局限性。我们回顾了三种方法，并讨论了现有技术在解决这些问题方面的限制。我们认为，这些限制可能对数学应用和人类书写的数学内容的理解有重要影响。

Abstract

The paper discusses the capacities and limitations of current artificial intelligence (AI) technology to solve word problems that combine elementary knowledge with commonsense reasoning. No existing AI systems ca

artificial intelligence commonsense reasoning word problems natural language technology automated theorem verifier

发现论文，激发创造

走向可行的数学推理：解决数学应用题的挑战、策略和机遇

研究了解决自然语言描述的数学问题的非神经和神经方法，并突出了这些方法具有可泛化、数学合理、可解释和可解释的能力，提出使用外部知识和知识渗透学习的需求和机会。

Oct, 2021

机器学习和信息论概念对人工智能数学家的贡献

当前人工智能的最新技术在语言方面非常出色，但在数学推理方面则相对不足。本文以数学家的思维方式为参考，建立在当前深度学习在直觉和习惯性行为等方面取得成功的基础上，指出其在推理和稳健性不确定性估计等方面仍存在重要缺陷。文中以信息论的观点探讨了什么样的数学陈述是有趣的，这可能为塑造高级数学家人工智能的未来工作提供指导。重点不是证明给定的定理，而是发现新奇的猜想。核心假设是，一个有用的定理组应更好地总结所有可证陈述的集合，例如通过具有较小的描述长度，同时在推导步骤的数量上接近许多可证陈述。

Mar, 2024

面向目标驱动的人工智能综述

人工智能在几个关键方面仍然比人类智能有限，如在理解上下文、言外之意和微妙线索方面的能力。本文展望了可能用于缩小人类智能与机器智能差距的机器智能候选方法，重点讨论了当前人工智能技术的不足，以及层次规划和能量基、潜变量方法以及联合嵌入预测架构方法如何帮助弥合这一差距。

Aug, 2023

人工智能中的抽象与类比推理

本文综述了人类学习、推理和适应新领域的关键能力 —— 概念抽象和类比制定，以及通过符号方法、深度学习和概率编程归纳等多种途径构建具有这些能力的 AI 系统的优势和局限性，最后提出了设计挑战任务和评估指标的几点建议，以在此领域取得量化和可推广的进展。

Feb, 2021

数学的人工智能：认知科学视角

人工智能领域的认知科学视角在构建人类或超人类水平的数学系统方面具有重要价值，通过借鉴认知科学的经典和持续研究方向，与人工智能研究人员和数学家的跨学科合作，可以推动数学人工智能系统的进一步发展。

Oct, 2023

自动常识推理基准：一项调查

论文概述了 AI commonsense benchmarks 的发展与应用、common sense 的本质及其在 AI 中的作用、构建 commonsense benchmarks 所服务的目标和理想特征。作者分析了现有 benchmark 的常见缺陷，调查了各种构建 commonsense benchmarks 的方法，总结了 139 个 commonsense benchmarks。然而，作者指出现有 benchmark 存在的空缺和 commonsense 推理的方面，并提出了未来的建议。

Feb, 2023

走向新常识科学

本篇论文讨论了人工智能中普遍存在的缺乏常识与人类智能的巨大差距，提出了从更广泛的角度考虑人工智能中的常识，处理完整的认知系统，并倡导对人工智能领域的常识知识进行全新的科学探索。

Dec, 2021

一款解决大学数学问题的 AI 程序的限制

Drori 等人（2022 年）使用符号代数包 Sympy 而非神经网络解决了大学数学问题，并通过计划合成和少量学习回答了 81％的问题，此外，它的 “解释” 仅是代码行的改写且在某些情况下似乎使用测试语料库中给定的答案来指导其解决问题的步骤。

Aug, 2022

人工智能中的快思慢想

本研究提出借鉴认知理论以推进 AI 的研究方向，通过嵌入因果组件来获得适应性、推理能力、常识理解等人类决策能力，以期激发 AI 技术研究，进而更好地理解人类和机器智能。

Oct, 2020

面向对话 AI 的常识推理：现有技术综述

本论文调查了最近关于常识推理的谈话人工智能研究，列出了相关的训练数据集，并描述了在谈话人工智能中包含常识的主要方法，讨论了用于评估谈话人工智能中常识的基准，最后对两个最先进的开放对话模型 BlenderBot3 和 LaMDA 的常识能力进行了初步观察，并对自然交互产生了负面影响，进一步激发了关于常识推理在谈话人工智能中的研究。

Feb, 2023