ChatGPT 参加计算机科学考试

Mar, 2023

ChatGPT Participates in a Computer Science Exam

Sebastian Bordt, Ulrike von Luxburg

TL;DRChatGPT 参加了计算机科学算法与数据结构的本科考试并取得 20.5 分的好成绩，但这并不意味着 ChatGPT 理解了计算机科学；同时，使用 GPT-4 的性能比 GPT-3.5 高出 17％，可以达到平均学生的水平。

Abstract

We asked chatgpt to participate in an undergraduate computer science exam on ''algorithms and data structures''. The program was evaluated

chatgpt computer science exam algorithms and data structures performance gpt-4

发现论文，激发创造

分析 ChatGPT 在计算机工程导论课程中的适应能力

本文旨在评估人工智能工具 ChatGPT 在计算机工程学科中的表现；研究发现它可以回答关于概念的问题，但由于它是一种文字工具，所以无法处理需要用到图表和手工实验的问题。

Mar, 2023

探索 ChatGPT 在本科计算机科学课程中作为学习和评估工具的应用：机遇与挑战

本研究论文讨论了将人工智能用于高等教育中的教学与学习，并以 ChatGPT 作为工具，以计算机科学基础编程课程为例进行了教学和评估的探讨，结果显示使用 ChatGPT 的学生在得分上有优势，但提交的代码存在不一致和不准确的情况。

Apr, 2023

ChatGPT 与机械工程：在 FE 机械工程和本科考试中的表现分析

本研究探讨了 ChatGPT 在机械工程学科中的能力，并通过使用大学提供的初级和高级机械工程考试题目以及机械工程基础考试（FE）的模拟题目，分析了两个 ChatGPT 模型的回答。结果发现，付费订阅模型（GPT-4）在正确率上远远超过免费版本（GPT-3.5），但由于两个模型仅支持文本输入，因此都不太可能通过 FE 考试。研究结果确认了 ChatGPT 在文献中关于错误类型和陷阱的发现，其最适合具有专业知识的用户使用。

Sep, 2023

ChatGPT 在数学推理和问题解决中的有效性研究：来自越南国家高中毕业考试的证据

该研究对 ChatGPT 在越南高中毕业考试的数学题目中的表现进行了全面的分析，探讨了无法正确回答问题的挑战。

Jun, 2023

ChatGPT 在标准化考试中的表现 -- 学习者的一种拟议策略

ChatGPT 在标准化考试准备中的问题解决能力及其潜在应用进行了探索，重点关注 GRE 数学考试。本研究调查了 ChatGPT 在 GRE 数量领域的不同问题类型上的表现，并研究了修改问题提示对其准确性的影响。研究结果表明，在对原始问题使用指令引导和上下文提示后，ChatGPT 的准确性有了统计上的改进。与原始数据 69% 的准确率相比，修改后的提示下 ChatGPT 的准确率达到了 84%。研究讨论了 ChatGPT 在某些问题上的困难之处以及提示修改对于 GRE 等标准化考试准备的帮助，并提供了未来的研究方向。

Sep, 2023

ChatGPT 能否通过入门级函数式编程课程？

本文系统评估了 ChatGPT 在初级函数语言编程课程中的表现，证明其能够在该课程中获得 B- 的成绩，并排名为 314 名学生的第 155。作者认为 ChatGPT 对计算机科学教育的潜在益处值得探究。

Apr, 2023

基于 ChatGPT 作弊的测试题漏洞研究

ChatGPT 对测试问题的回答质量以及如何检测测试问题是否可由 ChatGPT 正确回答的方法是本研究的重要问题。我们通过对 MedMCQA 数据集中的问题生成 ChatGPT 的回答，并分析了不同类型问题中 ChatGPT 回答准确度较低的情况。此外，我们还开发了一个基本的自然语言处理模型，用于在一组问题或样本考试中识别出对 ChatGPT 最容易攻击的问题。这个工具可以帮助考试制作者避免出现易受 ChatGPT 攻击的测试问题。

Feb, 2024

编程测试中不当福利和 ChatGPT 滥用的识别：一项受控实验

ChatGPT 的使用会加速编程测试的完成速度，为学生提供参考代码，但存在学术诚信问题和可能的抄袭风险。

Aug, 2023

Chat GPT 能解决语言学考试吗？

研究通过使用 ChatGPT4，即使用语言模型 GPT4 的 ChatGPT 的版本，评估其是否能够成功解决介绍性语言学考试。结果表明，该语言模型在解释复杂且嵌套的任务方面非常成功，但在分析形态和短语方面表现较差。在简单情况下，其表现尚可，但对于罕见的缺少一对一对应关系的情况，结果则不尽相同。该模型尚不能处理诸如分析或生成语法树等可视化任务，但通过对这些任务进行更广泛的预处理，将其转化为文本数据，可以成功解决这些任务。

Nov, 2023

揭示巨人真面目：ChatGPT 在编写算法和数据结构方面的全面评估

本文对 ChatGPT 的编码能力进行全面评估，重点考察了其在 Python 编程语言和数据结构与算法等基础计算机科学问题上的表现，包括解决问题的能力、代码质量和运行时错误性质，探究了其对训练数据的直接记忆现象，并在各个子主题和难度不等的问题上与人类表现进行对比研究。

Jul, 2023