Mar, 2022

通过端到端上下文感知聚类为开放式响应调查提供洞察

TL;DR本研究提出了一种新颖的端到端的上下文感知框架,该框架可提取、聚合和缩略嵌入式语义模式的开放响应调查数据,在识别度上优于传统的基于关键词的方法。利用预训练的自然语言模型对文本数据进行编码,将其转化为语义向量,并通过聚类的方式将向量划分到若干组并提取关键词或总结句,为每一组提供上下文感知的词云,并遵守用户隐私的设计。该方案可应用于移动设备的实时分析,减轻了对来自调查数据的信息提取成本。