Oct, 2022

特征工程与 BERT 在 Twitter 数据上的比较

TL;DR通过比较传统机器学习模型使用特征工程和词向量与最先进的语言模型 BERT 使用词向量在三个数据集上的表现,并考虑特征工程与 BERT 的时间和成本效益。研究证明,在三个数据集中,BERT 模型只有在其中一个数据集上胜于传统的特征向量分类器,使用 BERT 模型可以获得 0.03 和 0.05 的准确度和 F1 分数的提高,其中 BERT 模型表现显着优于传统分类器。因此,在该数据集上使用 BERT 模型值得花费时间和成本,而在其他数据集上则不值得。