大型语言模型探索多样化设计解决方案的能力
本论文研究利用自然语言处理和机器学习技术进行概念生成,比较生成方案和众包解决方案的异同,结论表明,利用 LLM 技术生成的方案平均可行性和实用性更高,而众包解决方案更具新颖性。
May, 2023
通过提出一个框架,使用户能够无缝地探索、评估和综合多种响应,并通过 Luminate 互动系统与 8 名专业作家的用户研究展示了这个框架的可行性和有用性,我们推进了与大型语言模型的创造性任务互动的方式,引入了一种利用大型语言模型的创造潜力的方法。
Oct, 2023
调查了大型语言模型(LLMs)在生成多样化观点和理由方面的能力,提出了一种基于标准提示技术来衡量透视多样性的方法,并发现利用句子嵌入和距离度量来衡量语义多样性是不够的。研究结果表明,LLMs 能够根据任务主观性的程度产生多样的观点。
Nov, 2023
大型语言模型 (Large Language Models, LLMs),如 GPT-4 的进步为生成设计提供了新的机会,本文调查了该工具在整个设计和制造流程中的应用。通过一系列示例,我们突出了当前 LLMs 的优点和局限性,旨在推动这些模型的持续改进和进步。
Jul, 2023
通过收集专家材料偏好的数据集,该研究提供了评估大型语言模型在材料选择方面与专家建议相符程度的基础,并通过提示工程和超参数调整比较了大型语言模型在各种设计情景下与专家选择的性能。该研究的结果强调了大型语言模型在材料选择方面的两种失败模式,并发现并行提示作为一种有用的提示工程方法。研究结果进一步指出,虽然大型语言模型可以提供有价值的帮助,但它们的建议通常与人类专家存在明显差异,这突显了进一步研究如何更好地调整大型语言模型以复制专家决策的重要性。该研究为大型语言模型如何融入设计过程的日益增长的知识库做出了贡献,提供了关于它们当前限制和未来改进潜力的见解。
Apr, 2024
最新研究表明,大型语言模型(LLMs)在创造性方面可以超越人类的能力,特别是在发散性思维和创造性写作等特定创造性任务方面,这项研究使用创造力科学的最新进展构建了一个评估 LLMs 创造力的深入分析框架与一个包含 10 万人的实验数据集进行对比,既为更具创造力的 LLMs 的发展开辟了新的路径,也促进了对由人类独特的创新思维过程构成的与那些可以人工生成的元素的更细致的研究。
May, 2024
研究了如何同时呈现多个大型语言模型的响应,设计了包括计算文本文档之间相似性和差异性的预存和新方法以及如何渲染它们的输出的五个特征,通过对用户研究和八个案例研究的评估发现这些特征支持多样的意义理解任务,并使之前被认为过于困难的任务现在变得可行,最后提出了设计指南以指导未来对新型大型语言模型界面的探索。
Jan, 2024
利用大语言模型在现代教育领域创新的机会,通过研究提问型大语言模型、语法错误解释和人力资源面试评估,揭示了大语言模型在改变教育实践中的潜力和限制。
May, 2024
通过文献综述和第一手实验,本文研究了大型语言模型(LLMs)的潜力。尽管 LLMs 具有成本效益和高效性等优点,但也存在着诸如提示调优、偏见和主观性等挑战。该研究通过利用 LLMs 进行定性分析的实验提供了新的见解,强调了成功和限制。此外,本文还讨论了缓解挑战的策略,如优化提示技术和利用人类专业知识。我们的工作旨在将 LLMs 有机地融入人机交互数据工作,并积极促进其负责任的应用,以此回应关于 LLMs 在研究中负责任应用的持续对话。
Apr, 2024
通过使用众包任务的具体和包含示例的指导性说明书,我们发现,使用众包管道作为大语言模型(LLMs)的提示可以产生比基线提示更多样化的信息。同时,我们还讨论了人类作者和 LLMs 生成的信息的其他影响。
Aug, 2023