Dec, 2023
跨语言文本分类与识别的深度学习和嵌入可视化的比较分析
Comparative Analysis of Multilingual Text Classification &
Identification through Deep Learning and Embedding Visualization
TL;DR该研究通过深度学习和嵌入可视化对多语言文本分类方法进行比较研究,特别关注FastText和Sentence Transformer模型,并探索了维度对聚类的影响。研究结果显示,FastText在二维可视化中显示出更清晰的聚类效果,取得了显著的准确性、精确率、召回率和F1分数,优于Sentence Transformer模型。该研究强调了这些技术在多语言文本分类中的有效性,并强调了使用大型多语言语料库进行嵌入训练的重要性。它为未来的研究奠定了基础,并辅助开发语言检测和分类系统。此外,研究还对多层感知机、LSTM和卷积模型进行了比较。