May, 2023
基于跨语言词向量的多语言新闻聚类研究
Research on Multilingual News Clustering Based on Cross-Language Word Embeddings
Lin Wu, Rui Li, Wong-Hing Lam
TL;DR本文提出一种用于分类跨语言新闻的 incorporating clustering 模型,该模型使用跨语言向量表示新闻,使用 LDA 主题模型表示新闻内容,采用 Single-Pass 聚类算法进行优化,并利用知识蒸馏技术,将两个语义空间拟合为一个混合语义空间。