May, 2023

使用生成式语言模型进行大规模文本分析:以 AI 专利中公共价值表达为例的案例研究

TL;DR使用生成式语言模型 (GPT-4) 新方法进行大规模文本分析。将这一方法应用于发现美国人工智能专利中的公共价值表达。使用我们设计的 GPT-4 提示和调查数据库中的所有专利文件,以确定和标记 AI 专利句中的公共价值表述。使用由 GPT-4 生成的标签来训练 BERT 模型的分类器,从而获得高的 F1 分数。这表明,使用有条理的框架设计和交互式人类监督,生成式语言模型可以在产生标签和理性方面具有显着优势,同时不会降低质量。