May, 2023

使用多项式朴素贝叶斯算法和词项频率 - 逆文档频率(TF-IDF 向量化)检查菲律宾新闻推文的可信度

TL;DR利用基于地面真值注释和 TF-IDF 作为特征提取的新闻文章作为训练数据集的研究表明,使用 Multinomial Naive Bayes 的模型在训练中的准确率为 99.46%,在预测未见数据时为 88.98%;但其在将假新闻标记为真实新闻方面的问题需要进一步研究,提高语料库收集,并使用集成机器学习来加强预测的建议。