创造性束搜索
大型语言模型在创造性任务中表现得相当有创造力,但研究关于 LLM 创造力的过程主要集中在产品上,对创造过程的关注较少。我们提供了一种自动化方法来描述人类和 LLM 如何在交替使用任务和语言流利性任务中探索语义空间,并与其在行为上的对比。我们使用句子嵌入来识别响应类别和计算语义相似性,进而生成跳转轮廓。我们的结果证实了人类之前的工作,报告了持久性(对少量语义空间进行深度搜索)和灵活性(在多个语义空间中广泛搜索)两种创造力路径,两种路径都导致相似的创造力得分。LLM 在坚持性和灵活性路径上存在偏差,且在不同任务中变化。尽管 LLM 群体与人类个体相匹配,它们与创造力的关系不同,表现更灵活的模型在创造力方面得分更高。我们的数据集和脚本可以在 GitHub 上获得。
May, 2024
最新研究表明,大型语言模型(LLMs)在创造性方面可以超越人类的能力,特别是在发散性思维和创造性写作等特定创造性任务方面,这项研究使用创造力科学的最新进展构建了一个评估 LLMs 创造力的深入分析框架与一个包含 10 万人的实验数据集进行对比,既为更具创造力的 LLMs 的发展开辟了新的路径,也促进了对由人类独特的创新思维过程构成的与那些可以人工生成的元素的更细致的研究。
May, 2024
通过提出一个框架,使用户能够无缝地探索、评估和综合多种响应,并通过 Luminate 互动系统与 8 名专业作家的用户研究展示了这个框架的可行性和有用性,我们推进了与大型语言模型的创造性任务互动的方式,引入了一种利用大型语言模型的创造潜力的方法。
Oct, 2023
本研究旨在建立一个有效的框架,评估大型语言模型的创造力水平,通过改编 Torrance 创造性思维测试方法,研究评估了各种任务中的创造性表现,包括流畅性、灵活性、独创性和详尽度等 4 个标准,并发现大型语言模型在独创性方面表现不足,但在详尽度方面优秀,还揭示了模型的创造力受提示和角色扮演设置的显著影响,多个模型合作也可以增强独创性,此外,人工评估和大型语言模型对创造力的影响存在一致性,强调了大型语言模型设计对创造力的重要影响。
Jan, 2024
该研究通过一个深入的案例研究,评估了大型语言模型在创意写作过程中作为辅助工具的潜力。研究中开发了交互式多声音提示策略,交织了背景描述、指导写作的指令、目标风格的文本示例和给定示例的关键讨论,并从文学批评的角度以及计算创造力的角度进行了定性评估。研究结果支持大型语言模型能够实现高级提示的观点。
Nov, 2023
本论文研究利用自然语言处理和机器学习技术进行概念生成,比较生成方案和众包解决方案的异同,结论表明,利用 LLM 技术生成的方案平均可行性和实用性更高,而众包解决方案更具新颖性。
May, 2023
大型语言模型的艺术潜力在创意编码中的艺术家与人工智能协作中被广泛利用,我们的研究揭示艺术家创作过程中这种协作方式中的反思类型,比较了整个程序和多个子任务两种常见的协作方式,并通过实验数据和定性访谈展示了艺术家在两种不同方法中的不同反思激发,并显示了反思类型与用户表现、用户满意度和主观体验的相关性。同时,我们从艺术家的视角提供了人工智能协作的关键观点,并为未来 AI 辅助创意任务的设计提供了建议。
Feb, 2024