本研究提出了一种使用深度学习方法来检测 2017 年 Clickbait Challenge 数据集中的 clickbaits 的模型,同时利用数据分析和可视化技术探索和发现数据集中的信息。该模型在均方误差方面在 Clickbait Challenge 2017 中获得了第一名。
Jun, 2018
该研究提出两个二分类器和两种方法,用于分类和揭露标题党,并为第二个任务创建了模型,其中利用问题回答模型来确定标题党的起始和结束位置。
Jun, 2023
该研究旨在使用自然语言特征提取方法在机器学习中,将朴素贝叶斯、逻辑回归和支持向量机等基本模型用于检测讨论线路偏离主题时教师必须介入的情况,从而实现文本分类和语义分析。
Nov, 2022
提出了一种基于神经网络,包括双向 LSTM、注意力机制、孪生网络及卷积神经网络的新型点击诱饵检测方法来预测社交媒体帖子的点击诱饵得分,在 19538 个社交媒体帖子的测试语料库上达到 65.37% 的 F1 得分,优于之前的工程学特征或其他方法。
Oct, 2017
通过文本摘要总结内容,并根据生成的摘要与内容之间的相似性进行 clickbait 检测,本文提出了一种基于提示调整的 clickbait 检测方法,该方法通过预训练语言模型产生高质量的新闻摘要,并将头条和新生成的摘要作为提示调整的输入,采用各种策略结合外部知识以提高 clickbait 检测性能。在知名 clickbait 检测数据集上的广泛实验表明,我们的方法达到了最先进的性能。
Apr, 2024
本研究旨在通过使用人文和社会科学中的各种理论以及无监督和监督机器学习算法,以及人类好奇心作为二元分类器的基础,试图量化人类在数字世界中的好奇心,并通过人工注释的新闻标题(clickbaits)来解释如何测量刺激产生读者好奇心的强度,以推动数字媒体中好奇心和愤怒的情感定量研究。
本研究通过重新定义问题、识别模糊和具有误导性的标题,并利用类序贯规则和共同训练的方法,成功筛选出来自不同来源的不准确标题,并进行数据分析。
May, 2017
使用 Kaggle 平台提供的包含 18 年新闻的数据集,通过 TF-IDF 特征提取和神经网络分类器,对新闻标题进行分类,实验结果表明,该神经网络在准确性评估指标上表现最佳,其准确率高达 0.8622,明显优于其它三个模型。
Jan, 2022
本文介绍了一种基于循环神经网络的神经网络架构,用于检测新闻标题中的 'clickbait',该模型依靠从大型未注释的语料库中学习的分布式词表示和通过卷积神经网络学习的字符嵌入。在新闻标题数据集上的实验结果表明,这种方法表现优于现有的 'clickbait' 检测技术,具有 0.98 的准确率,0.98 的 F1 得分和 0.99 的 ROC-AUC 度量。
Dec, 2016
提出一个并不仅使用视觉特征,还使用从内嵌文本中提取的文本线索实现广告图像自动分类的框架,利用广告图像所含的有意义的文本内容,在分类任务中提供有益的语义解释,并使用现成组件开发框架来展示文本线索在语义分类任务中的有效性。