通过大型语言模型模拟表格数据集以快速探索关于真实世界实体的假设
利用大型语言模型 (LLMs) 的增强功能,扩展人文社会科学领域的数据分析,用于量化、自动化以前需要人工进行的定性分析任务。本文提出了一种系统的混合方法框架,结合了定性分析专业知识、机器可扩展性和严格的量化分析,同时注重透明度和可复制性。通过16个机器辅助案例研究作为概念验证,展示了该框架的应用,涉及的任务包括语言和话语分析、词汇语义变化检测、访谈分析、历史事件因果推断和文本挖掘、政治立场检测、文本和思想重用、文学和电影的流派构成、社交网络推断、自动词典编纂、丢失的元数据补充以及多模态视觉文化分析。与现有LLM应用文献的英语重点不同,这里的例子涉及较小语言和易于数字化失真的历史文本场景。除了需要专业知识的最困难的任务外,生成LLMs可以作为可行的研究工具。LLM (和人工) 标注可能包含错误和变化,但协议率可以在后续统计建模中考虑;文章还讨论了一个引导式方法。案例研究的复制实验证明,以前需要团队努力和复杂计算管道才能完成的任务,现在可以由辅助LLM的学者在更短的时间内完成。重要的是,这种方法旨在增强研究者的知识和技能,而不是取代它们。鉴于这些机会,定性专业知识和提出有深度问题的能力无疑变得更加关键。
Sep, 2023
本文探索大型语言模型在心理学应用中的前沿。大型语言模型如ChatGPT正在改变心理学研究的方式,并在认知与行为心理学、临床与咨询心理学、教育与发展心理学以及社会与文化心理学等多个领域发挥着影响,强调了它们模拟人类认知和行为的潜力。该论文还讨论了这些模型在心理学方面的能力,提供了创新工具用于文献综述、假设生成、实验设计、实验对象选择、数据分析、学术写作和同行评审。然而,尽管大型语言模型对推进心理学研究方法至关重要,但该论文也注意到了其技术和伦理挑战,如数据隐私、在心理学研究中使用大型语言模型的伦理影响以及对这些模型局限性的更深入了解的需要。研究人员应该负责任地在心理学研究中使用大型语言模型,遵守伦理标准,并考虑在敏感领域部署这些技术的潜在后果。总之,这篇文章全面概述了大型语言模型在心理学中的现状,探讨了潜在的好处和挑战。它号召研究人员在充分利用这些模型的优势的同时,负责任地解决相关风险。
Jan, 2024
本研究探讨了大型语言模型(LLMs)在生成人工数据中的不断扩大的作用。尽管人工数据能够与人类性能相匹配,但本文揭示了显著的潜在差异,尤其是在复杂任务中,LLMs常常错过对内在人类生成内容的微妙理解。该研究批判性地考察了多样化的LLM生成数据,并强调了在数据创建和使用LLMs时遵循道德实践的必要性。它凸显了解决LLM生成内容中产生的偏差和人为因素对于未来研究和开发的重要性。所有数据和代码都可在我们的项目页面上获得。
Jan, 2024
大型语言模型对作者的个人特质的预测能力有所降低,但作者的语言模式仍具有预测作者个人特质的能力,尽管在使用大型语言模型时,一些基于词汇的语言标志可能失去可靠性。这对于在大型语言模型时代研究个人特质的语言标志具有重要意义。
Mar, 2024
该研究使用心理测量学的方法,对OpenAI的GPT-3.5和GPT-4模型进行了人格特质测试。结果发现,使用普通人物描述时,GPT-4的回答表现出与人类相似的心理特点,而使用具体人口统计信息的情况下,两个模型的回答则表现较差,此研究对于大语言模型在模拟个体级人类行为方面提出了怀疑。
May, 2024
本研究探讨了大型语言模型(LLMs)在定性研究中替代人类参与的潜在问题。通过与19名定性研究者的访谈,发现虽然LLMs生成的数据引发了相似的叙述,但它们在参与者同意、代理性及深度上下文等方面存在根本性局限性。因此,使用LLMs作为参与者的代理引发了伦理和认识论的担忧。
Sep, 2024
本研究解决了文献驱动与数据驱动的假设生成方法互补性的问题。提出了一种新方法,将文献洞察与数据相结合,利用大型语言模型(LLM)进行假设生成,实验证明此方法在多个数据集上表现优于传统方法。此外,首次通过人类评估验证了LLM生成假设在复杂决策任务中的有效性,显著提高了人类的判断准确率。这一研究为假设生成提供了更全面的框架,潜在推动科学研究的新方向。
Oct, 2024
本研究针对作者归属中传统方法的局限性,提出了一种全新的贝叶斯方法,利用预训练的GPT模型进行一-shot作者归属分析。研究结果显示,该方法在IMDb和博客数据集上的分类准确率达到85%,为一-shot作者分析设定了新的基准,并扩展了大型语言模型在法语语言学中的应用。
Oct, 2024
本研究解决了传统定性分析方法在面对快速增长的文本数据时效率低下和主观性强的问题。通过系统性文献映射,揭示了大型语言模型(LLMs)在定性研究中的应用场景、方法和评估指标,发现LLMs有潜力自动化传统人工密集的定性过程,但仍面临提示工程依赖、偶尔不准确和上下文限制等挑战。该研究强调了结合人类专业知识和改进评估方法的机会,以推动LLMs在定性分析中的进一步应用。
Nov, 2024
本研究针对大型语言模型(LLMs)生成文本的特征与人类写作之间的差异进行了分析。通过对250个不同语言特征的分析,我们发现人类文本的变异性显著高于机器生成文本,尤其在对语言风格约束较少的文本类型中更为明显。研究表明,人类创作的文本在认知需求、语义内容和情感表达上具有更丰富的特征,强调了在理解LLM输出时需要引入有意义的语言特征。
Dec, 2024