潜在的数学和科学问题头脑风暴伙伴: LLMs
数学推理是评估人类智能基本认知能力的基石。该研究调查了大型语言模型在解决数学问题方面的真正进展、障碍、数学问题类型和相关数据集、解决数学问题的 LLM 技术范围、影响 LLMs 解决数学问题的因素和问题,并提供了这一快速发展领域中的现状、成就和未来挑战的整体观点。
Jan, 2024
最新研究表明,大型语言模型(LLMs)在创造性方面可以超越人类的能力,特别是在发散性思维和创造性写作等特定创造性任务方面,这项研究使用创造力科学的最新进展构建了一个评估 LLMs 创造力的深入分析框架与一个包含 10 万人的实验数据集进行对比,既为更具创造力的 LLMs 的发展开辟了新的路径,也促进了对由人类独特的创新思维过程构成的与那些可以人工生成的元素的更细致的研究。
May, 2024
通过大规模语言模型(LLMs)来预测神经科学实验结果,发现 LLMs 在预测实验结果方面超过了专家,并且经过优化的神经科学文献模型 BrainGPT 表现更好,这预示着人类与 LLMs 共同合作进行科学发现的未来。
Mar, 2024
通过多模型合作和多模型头脑风暴的方式,可以在逻辑推理和事实提取方面显著提高效果,并且发现两个小参数模型通过头脑风暴可以达到接近大参数模型的准确度,为大型语言模型的分布式部署提供了新的解决方案。
Jun, 2024
本文探索使用 GPT-4 解决更复杂的数学问题,并评估了各种使用 GPT-4 的方法,包括作者提出的新的对话式解决框架 - MathChat。针对 MATH 数据集中的困难高中竞赛题进行了评估,结果表明所提出的对话式方法具有优势。
Jun, 2023
本研究通过分析 GPT-4 在回答数学问题中的表现,探讨了大型语言模型在复杂的数学问题解决中的局限性和不足,为未来人工智能驱动的数学推理的研究和进展奠定了基础。
Mar, 2024
大型语言模型的艺术潜力在创意编码中的艺术家与人工智能协作中被广泛利用,我们的研究揭示艺术家创作过程中这种协作方式中的反思类型,比较了整个程序和多个子任务两种常见的协作方式,并通过实验数据和定性访谈展示了艺术家在两种不同方法中的不同反思激发,并显示了反思类型与用户表现、用户满意度和主观体验的相关性。同时,我们从艺术家的视角提供了人工智能协作的关键观点,并为未来 AI 辅助创意任务的设计提供了建议。
Feb, 2024
大型语言模型在岩土工程中的创新应用以及对数据处理和决策的提升潜力进行了探讨,同时指出了实施大型语言模型的挑战和专家监督的必要性。
Dec, 2023
大型语言模型 (Large Language Models, LLMs) 的迅猛发展正在革新数据科学和统计学,该论文旨在探讨 LLMs 对于数据科学教育的潜在机遇、资源和挑战,以及其在数据科学中的作用转变和创造性应用。
Jul, 2023