利用贝叶斯子集多臂赌博机和 GPT-4 提升人类创造力的学习
本研究测试了人工智能是否具备创造力,通过比较采用六种生成式人工智能聊天机器人生成的创意和人类生成的创意,研究发现虽然创意的生成方式不同,但是在创意质量方面没有明显的差异,并且有 9.4% 的人比 GPT-4 生成的创意更有创造力。研究表明生成式人工智能可以成为创意创造的有价值助手,持续研究和开发生成式人工智能在创造性任务中的应用具有重要意义,同时也探讨了生成式人工智能是否能够真正具备创造力的问题。
Mar, 2023
我们评估了 Open AI 的生成式自然语言模型 GPT-3 在 Guilford 的替代用途测试中的创造力,结果显示人类目前在创造性输出方面表现优于 GPT-3,但我们相信这只是时间问题。
Jun, 2022
本文使用 GPT-4 进行了多项实验来生成计算机代码,发现 AI 编码工具需要人类的验证才能确保准确性和可靠性。同时,使用 GPT-4 进行代码改进可以显著提高代码质量,但生成的测试仍需要人类验证。
Apr, 2023
本研究揭示了大型语言模型 (LLMs) 在某些情况下表现出具有人类直觉的行为,包括许多认知错误,并且通过使用 GPT-3.5 等最新技术的模型及进行人类直觉决策的试探研究证明了这一点,并探究了几种方法来测试 GPT-3.5 的倾向于类似直觉的决策及其机器行为等方面,以揭示出这些模型在认知科学方面的新兴特征和调整预期的潜力。
Dec, 2022
使用生成式 AI 模型和大规模语言模型来生成编程教育中的个性化反馈,为学生提供编程提示以帮助他们解决程序中的错误。通过使用 GPT-4 作为 “导师” 模型和符号信息来提高生成质量,然后通过使用 GPT-3.5 作为 “学生” 模型来验证提示质量,我们开发了一种名为 GPT4Hints-GPT3.5Val 的新技术,通过对三个实际数据集进行广泛评估展示了我们技术的有效性。
Oct, 2023
本文探讨利用人类书写的样例以几乎无监督的方式创作自由文本解释的任务,发现高质量的提示有助于提高语言模型的生成效果,同时人类研究表明 GPT-3 生成的解释在某些情况下能够胜过人工生成的解释;作者还结合 GPT-3 与学习自评价的筛选器对生成的解释进行过滤,结果表明这一方法能够实现较高水平的解释过滤。
Dec, 2021
本研究提出了一种结合行为和计算实验的框架,利用虚构提示作为一种新颖工具,研究人类和生成型 AI 在叙事中的文化产物和社会偏见。通过分析人类和大型语言模型对创建并与人工智能恋爱的相同提示的回应,实验证明了 Pygmalion 神话在人类和大型语言模型的集体想象中一直存在的普遍存在。分析揭示了 GPT-3.5 和特别是 GPT-4 的叙事在性别角色和性取向方面比人类更加进步。虽然人工智能的叙事偶尔会提供创新的情节转折,但其提供的情境和修辞比人类的文本更缺乏想象力。该提出的框架认为小说可以作为了解人类和基于人工智能的集体想象和社会维度的窗口。
Oct, 2023
本文提出和开发了一个针对带赌徒反馈的人机协作问题的解决方案,旨在利用人机互补性最大化决策收益,在多个人类决策者的环境中展开并表现出效用,并呈现出当机器和人类各自单独做出决策时,我们的方法胜过两者的能力,以及如何在多个人类决策者的情况下实现个性化路由以进一步提高人机团队的表现。
May, 2021
创意解决问题的支持,使用生成型 AI 技术的 Supermind Ideator 系统,包括大型语言模型、用户界面等,以帮助用户使用创意解决问题的技术。
Nov, 2023