Nov, 2023

MacGyver:大型语言模型是创造性问题解决者吗?

TL;DR我们研究了现代大型语言模型(LLMs)在一个受限制的环境中的创造性问题解决能力。为了达到这个目的,我们创建了一个名为 'MacGyver' 的自动生成数据集,包含 1,600 个故意触发功能固定性并需要 ' 跳出框架 ' 思考的现实世界问题。我们将问题集呈现给 LLMs 和人类,并比较两者的问题解决能力。我们展示了对于两组来说,MacGyver 都是具有挑战性的,但方式是独特且互补的。我们还提供了 LLMs 的详细错误分析,并展示了通过新颖的提示技术(如迭代的逐步反思和发散 - 收敛思维)来增强它们的问题解决能力的潜力。这项工作揭示了人类和人工智能的创造性问题解决能力,并说明了如何将心理学范式扩展到比较人类和机器的大规模任务中。