Jul, 2023

利用人群调整的生成式语言模型进行舆情挖掘

TL;DR我们提出了一种从文本集合中挖掘意见的新方法,该方法是使用在不同人群收集到的数据上训练的生成式语言模型。我们描述了意见洞察挖掘的基本定义、方法论和通用算法。通过在实验中展示预先训练的生成式模型使用经过特殊设计的内容进行精调,我们展示了我们的方法的性能,其中包含不自然且完全注释的意见。我们展示了我们的方法能够学习和将意见转移到语义类别中,同时保持极性的比例。最后,我们展示了使用洞察挖掘系统来从真实文本语料库中扩大发现意见洞察的用途。