Apr, 2024

概念诱导:使用 LLooM 对非结构化文本进行高级概念分析

TL;DR我们引入概念归纳,一种从非结构化文本中提取明确纳入标准的高级概念的计算过程,该过程通过使用大型语言模型不断合成抽样文本并提出具有不断广泛性的可解释概念。我们在具有毒性的在线评论数据集上实例化了 LLooM,并通过技术评估和四个分析场景的研究发现,LLooM 的概念在质量和数据覆盖方面优于传统的主题模型,并且在专家案例研究中能够帮助研究人员发现以前未注意到的见解。