学习者如何从文本中产生数据以分类点击诱饵

Jan, 2023

学习者如何从文本中产生数据以分类点击诱饵

How learners produce data from text in classifying clickbait

Nicholas J. Horton, Jie Chao, Phebe Palmer, William Finzer

TL;DR本研究是基于任务驱动面试方法，研究本科生如何使用包括文本数据在内的非结构化数据进行分类，并探究文本的特征，最终发现了三种类型的特征（功能，内容和形式），大部分在第一种情境中产生。

Abstract

Text provides a compelling example of unstructured data that can be used to motivate and explore classification problems. Challenges arise regarding the representation of features of text and student linkage betw

text data classification features task-based interview undergraduate students

发现论文，激发创造

使用神经网络识别网络新闻中的标题党

本研究提出了一种使用深度学习方法来检测 2017 年 Clickbait Challenge 数据集中的 clickbaits 的模型，同时利用数据分析和可视化技术探索和发现数据集中的信息。该模型在均方误差方面在 Clickbait Challenge 2017 中获得了第一名。

Jun, 2018

利用自然语言处理技术进行点击诱饵分类和内容剧透识别

该研究提出两个二分类器和两种方法，用于分类和揭露标题党，并为第二个任务创建了模型，其中利用问题回答模型来确定标题党的起始和结束位置。

Jun, 2023

使用机器学习模型对文本进行分类并确定对话偏移

该研究旨在使用自然语言特征提取方法在机器学习中，将朴素贝叶斯、逻辑回归和支持向量机等基本模型用于检测讨论线路偏离主题时教师必须介入的情况，从而实现文本分类和语义分析。

Nov, 2022

使用神经网络的多策略方法识别标题党

提出了一种基于神经网络，包括双向 LSTM、注意力机制、孪生网络及卷积神经网络的新型点击诱饵检测方法来预测社交媒体帖子的点击诱饵得分，在 19538 个社交媒体帖子的测试语料库上达到 65.37% 的 F1 得分，优于之前的工程学特征或其他方法。

Oct, 2017

通过文本摘要进行标题点击热点检测的提示微调

通过文本摘要总结内容，并根据生成的摘要与内容之间的相似性进行 clickbait 检测，本文提出了一种基于提示调整的 clickbait 检测方法，该方法通过预训练语言模型产生高质量的新闻摘要，并将头条和新生成的摘要作为提示调整的输入，采用各种策略结合外部知识以提高 clickbait 检测性能。在知名 clickbait 检测数据集上的广泛实验表明，我们的方法达到了最先进的性能。

Apr, 2024

如何为点贴式检测器建模好奇心

本研究旨在通过使用人文和社会科学中的各种理论以及无监督和监督机器学习算法，以及人类好奇心作为二元分类器的基础，试图量化人类在数字世界中的好奇心，并通过人工注释的新闻标题（clickbaits）来解释如何测量刺激产生读者好奇心的强度，以推动数字媒体中好奇心和愤怒的情感定量研究。

Jun, 2018

学习识别模糊和误导性新闻标题

本研究通过重新定义问题、识别模糊和具有误导性的标题，并利用类序贯规则和共同训练的方法，成功筛选出来自不同来源的不准确标题，并进行数据分析。

May, 2017

基于神经网络的虚假新闻标题分类

使用 Kaggle 平台提供的包含 18 年新闻的数据集，通过 TF-IDF 特征提取和神经网络分类器，对新闻标题进行分类，实验结果表明，该神经网络在准确性评估指标上表现最佳，其准确率高达 0.8622，明显优于其它三个模型。

Jan, 2022

使用神经网络检测点击诱饵：你绝不会相信接下来发生了什么！

本文介绍了一种基于循环神经网络的神经网络架构，用于检测新闻标题中的 'clickbait'，该模型依靠从大型未注释的语料库中学习的分布式词表示和通过卷积神经网络学习的字符嵌入。在新闻标题数据集上的实验结果表明，这种方法表现优于现有的 'clickbait' 检测技术，具有 0.98 的准确率，0.98 的 F1 得分和 0.99 的 ROC-AUC 度量。

Dec, 2016

利用场景文本理解广告

提出一个并不仅使用视觉特征，还使用从内嵌文本中提取的文本线索实现广告图像自动分类的框架，利用广告图像所含的有意义的文本内容，在分类任务中提供有益的语义解释，并使用现成组件开发框架来展示文本线索在语义分类任务中的有效性。

Jun, 2018