ChatGPT-4 中明显概念物理推理的进展

Mar, 2023

ChatGPT-4 中明显概念物理推理的进展

Advances in apparent conceptual physics reasoning in ChatGPT-4

Colin G. West

TL;DR使用巨大的语言模型建立了 ChatGPT，经 Kortemeyer 验证其在牛顿力学基础知识方面具有基本理解并达到专家水平，该结果对未来的物理教育和教学具有重要的启示。

Abstract

chatgpt is built on a large language model trained on an enormous corpus of human text to emulate human conversation. Despite lacking any explicit programming regarding the laws of →

chatgpt physics language model newtonian mechanics education

发现论文，激发创造

AI 和 FCI：ChatGPT 能否预测初级物理的理解？

这篇文章研究了 ChatGPT3.5 和 ChatGPT4 在大学物理中表现的能力，表明 ChatGPT3.5 可以达到甚至超过完成一学期大学物理的学生的中位数表现，而 ChatGPT4 的表现则已接近专业物理学家的水平。

Mar, 2023

探讨 ChatGPT 在科学与工程问题解决中的潜力和问题

本研究通过探索 OpenAI 的 ChatGPT 在解决不同类型的物理问题方面的能力，发现 ChatGPT 在解决给定完整数据的问题上的成功率为 62.5％，而在未给定全部必要数据的实际问题上的准确率下降至 8.3％。该研究提出了关于如何利用增强学习模型的教材来提升 STEM 教育的启示，并为人工智能的优势和局限性提供了见解，对于旨在利用该技术的教育工作者以及研究人员来研究问题解决和决策制定中的人工智能与人类协作框架有所贡献。

Oct, 2023

ChatGPT 是一个具有知识但缺乏经验的求解器：大型语言模型中常识问题的研究

研究 LLMs 和 GPTs 在处理常识问题中的表现，实验结果表明：(1) GPTs 在通识任务中可以取得较好的 QA 准确率，但仍然较难处理某些类型的知识。(2) ChatGPT 具有常识知识，可以利用知识提示正确生成大部分常识知识。(3) ChatGPT 是一名经验不丰富的常识问题解决者，不能准确地识别回答一个特定问题所需的常识知识，这需要更好的常识引导机制，如遵循指示、更好的常识引导等。

Mar, 2023

分析 ChatGPT 在计算机工程导论课程中的适应能力

本文旨在评估人工智能工具 ChatGPT 在计算机工程学科中的表现；研究发现它可以回答关于概念的问题，但由于它是一种文字工具，所以无法处理需要用到图表和手工实验的问题。

Mar, 2023

ChatGPT 在语言使用上是否与人类相似？

通过 12 个预注册的实验，我们发现像 ChatGPT 这样的运用大型语言模型的聊天机器人能够在很大程度上模仿人类语言处理，但是他们在一些方面与人类处理方式存在差异，并且可能通过 Transformer 架构来解释这些差异。

Mar, 2023

ChatGPT 与机械工程：在 FE 机械工程和本科考试中的表现分析

本研究探讨了 ChatGPT 在机械工程学科中的能力，并通过使用大学提供的初级和高级机械工程考试题目以及机械工程基础考试（FE）的模拟题目，分析了两个 ChatGPT 模型的回答。结果发现，付费订阅模型（GPT-4）在正确率上远远超过免费版本（GPT-3.5），但由于两个模型仅支持文本输入，因此都不太可能通过 FE 考试。研究结果确认了 ChatGPT 在文献中关于错误类型和陷阱的发现，其最适合具有专业知识的用户使用。

Sep, 2023

ChatGPT 的数学能力

本研究使用 GHOSTS 数据集评估了 ChatGPT 的数学能力和其他训练过数学语料库的模型相比，发现其数学能力显著低于普通数学研究生，并强调 GHOSTS 数据集的重要性以及未来大型语言模型在高级数学理解方面的比较研究。

Jan, 2023

未经反思的接受 —— 探索 ChatGPT 在物理教育问题解决中的负面影响

我们的研究聚焦于高等物理教育，研究了问题解决策略。研究结果显示，虽然学生在专业领域对 ChatGPT 过度依赖，却存在误判的情况；此外，在使用 ChatGPT 时，学生普遍缺乏反思，出现了与传统搜索引擎有明显不同的交互行为。因此，我们强调有必要引导学生如何与大型语言模型进行交互，并对潜在问题进行提醒。

Aug, 2023

大型语言模型是否能够很好地玩文本游戏？现状和开放问题

本技术报告针对大型语言模型 (ChatGPT 和 GPT-4)，探究它们在玩文字游戏方面的能力，实验证明 ChatGPT 表现与现有系统相比具有竞争力，但仍没有足够的智能去构建游戏世界模型、利用已有世界知识和推断游戏进程中的目标。这为人工智能、机器学习和自然语言处理交叉领域开辟了新的研究问题。

Apr, 2023

语言笔者大：LLMs、ChatGPT、接地、意义与理解

ChatGPT 是如何运作并具备超过预期能力的？本文通过与 ChatGPT-4 对话的方式，对 ChatGPT 作出解释，包括与语言自身相关的良性偏见、语言的间接语义基础以及神经网络中的类别学习等。

Feb, 2024