Jan, 2024

在标记零售银行交易过程中使用零点提示的自动创建和扩展主题分类系统

TL;DR通过使用基于指令的精调大型语言模型(LLMs),本研究提出了一种无监督方法来自动生成和扩展主题分类法。我们运用主题建模和关键词提取技术创建初始主题分类法,并使用 LLMs 对结果进行后处理以创建层次结构。为了通过新术语扩展现有分类法,我们使用零样本提示来确定在何处添加新节点,这是首次在分类任务中提出此种方法。我们使用生成的分类法为来自零售银行数据集的商户分配标签。为了评估我们的工作,我们请 12 位志愿者回答一个两部分的表格,首先评估创建的分类法质量,然后评估基于该分类法为商户分配的标签。评估结果显示所选分类法的一致性率超过 90%,而商户分配的平均一致性超过 80%。