Nov, 2023

如何使用大型语言模型进行文本编码:以公共政策文件中的父亲角色为例

TL;DR近期大语言模型(LLM)如 GPT-3 和 GPT-4 在政治学领域的文本分析方面取得了新突破,它们承诺以更好的结果和更少的编程工作来实现自动化。本研究评估 LLM 在三个原始编码任务的非英文政治学文本上的效果,并提供了在政治学研究中使用 LLM 进行文本编码的详细说明。我们的案例研究为希望将 LLM 纳入文本分析研究的研究人员提供了实用指南。我们发现,当提供了详细的标签定义和编码示例时,LLM 可以与甚至优于人工标注员,且速度快得多(高达数百倍),成本更低(比人工编码节省高达 60%),且更易于扩展到大量文本。总体而言,LLM 是大多数文本编码项目的可行选择。