Dec, 2022

通过整合多种类型的上下文,实现有效的种子引导主题发现

TL;DR本文提出一种基于三种不同上下文信号的种子引导主题发现方法,该方法结合了来自本地上下文的词嵌入,来自通用域训练的预先训练语言模型表示以及基于种子信息检索的主题指示句子,证明了三种类型的语境信息的价值和局限性在种子引导下的建模词语语义,并提出了一种迭代框架SeedTopicMine,该框架通过集成排名过程逐步融合了它们的上下文信号,相较于现有的种子引导主题发现方法,提供更一致和准确的主题。