May, 2023

自然语言处理中各种文本嵌入对聚类性能的影响

TL;DR本研究探讨了在电商平台的评论中使用聚类算法对评论星级进行重新标注的任务,使用了 BERT 和 Word2Vec 两种不同的文本嵌入来表示文本,并测量了各种聚类算法(包括 KMeans,单连系群聚类和基于密度的算法)的性能,结果表明嵌入类型对算法性能有很大的影响。