Feb, 2024

一种基于 BERT 的新型分类器,用于根据 YouTube 视频标题检测其政治倾向

TL;DR美国约四分之一的成年人定期通过 YouTube 获取新闻内容。然而,尽管该平台上存在大量政治内容,但迄今为止还没有提出可以识别 YouTube 视频政治倾向的分类器。为了填补这一空白,我们提出了一种基于 Google 的语言模型 Bert 的新型分类器,仅通过视频标题将 YouTube 视频分为六类:极左、左派、中间、反唤醒、右派和极右。我们使用一个公共数据集中的 1000 万个 YouTube 视频标题(涵盖各种类别)来训练和验证所提出的分类器。我们将分类器与使用相同数据集训练的几种替代算法进行了比较,结果显示我们的分类器在准确性(75%)和 F1 分数(77%)方面都达到了最高水平。为了进一步验证分类性能,我们从包括 Fox News 和 New York Times 在内的多家知名新闻机构的 YouTube 频道收集视频,并将我们的分类器应用于它们的视频标题。在绝大多数情况下,预测的政治倾向与新闻机构相匹配。