Aug, 2023

语义文本相似度中文程序缩略模型的比较研究

TL;DR比较语义文本相似性方法在检索类似缺陷报告方面的有效性,使用 TF-IDF(基线)、FastText、Gensim、BERT 和 ADA 等嵌入模型来评估性能。研究结果表明,BERT 一般在召回率方面表现优于其他模型,其次是 ADA、Gensim、FastText 和 TFIDF,对检索类似缺陷报告任务选择合适的嵌入方法的影响进行了探讨。