Nov, 2023

BanglaBait: 孟加拉语点击诱饵数据集上的半监督对抗性方法

TL;DR通过构建达到 15,056 个标记的新闻文章和 65,406 个未标记的新闻文章的第一个孟加拉 clickbait 检测数据集,应用 SS GANs 对 Semi Supervised Generative Adversarial Networks 进行微调,我们提出的新模型作为该数据集的一个良好基准,优于传统神经网络模型(LSTM、GRU、CNN)和基于语言特征的模型,这一研究将为未来检测孟加拉文 clickbait 标题提供一个基础。