大学生报纸中的无监督偏差检测

AAAISep, 2023

Unsupervised Bias Detection in College Student Newspapers

Adam M. Lehavi, William McCormack, Noah Kornfeld, Solomon Glazer

TL;DR该论文介绍了一种几乎没有人为干预的流程，用于抓取和检测大学报纸档案中的偏见。该论文介绍了一种框架，用于从自动化工具无法获取数据的复杂档案网站中进行抓取，并生成了 14 份学生论文的数据集，总共含有 23,154 个条目。该数据还可以通过关键词查询，通过比较大型语言模型摘要和原始文章的情绪来计算偏见。该方法具有较少的比较性，比重建偏见更少地需要有标签的数据。结果基于具有政治色彩的词汇以及控制词汇来计算，以展示如何得出结论。这种完整的方法有助于从学生报纸来源中提取细微的见解，且假设和分类最少，为更客观地理解偏见铺平了道路。

Abstract

This paper presents a pipeline with minimal human influence for scraping and detecting bias on college newspaper archives. This paper intr

scraping detecting bias college newspaper archives dataset sentiment analysis

发现论文，激发创造

新闻文章中的政治偏见量化

本文旨在建立一种自动模型，评估在线新闻文章的意识形态偏见，结果表明目前的自动模型能力不足以被用于自动注释文档，进而计算搜索结果中的偏见。

Oct, 2022

不可靠新闻检测数据集中的隐性偏见

本文研究了自动检测不可靠新闻的问题和如何创建更可靠的数据集，发现大规模新闻数据集存在选择性偏差和混淆因素，导致模型的表现不稳定，提出了创建更可靠的数据集的建议。

Apr, 2021

发展自然语言理解模型以描述有线新闻偏见

通过对使用命名实体识别分析主题并通过立场分析讨论这些主题的方法，我们开发了一种无需任何人为输入来定义有线新闻节目偏见的无监督机器学习方法，应用于 2020 年的有线新闻转录中，发现节目的聚类随时间的变化而保持稳定且大致对应于节目所属的有线新闻网络，该方法揭示了未来客观评估媒体偏见和描绘陌生媒体环境的潜力。

Oct, 2023

在不同粒度上分析新闻文章中的政治偏见和不公平性

本研究利用一个新的、基于 6964 篇新闻文章的辅助指标标签的语料库，开发了一种神经模型对新闻文章中的政治偏见和不公平进行分析，并从单词到整篇文章的不同层次的文本粒度发现了深刻的偏见模式。

Oct, 2020

DocNet: 归纳偏置检测模型中的语义结构

社交媒体正在成为新闻的主要入口，但由于人们的观点不同，新闻将存在偏见。本文探讨了新闻文章中经常被忽视的偏见检测方面：语义结构。我们提出了一种新颖的归纳式、资源有限的文档嵌入和偏见检测模型（DocNet），其性能超过了大型语言模型。我们还证明了来自相对立政治立场的新闻文章的语义结构（以文档级图形嵌入表示）具有显著的相似性。这些结果可用于提高资源有限环境中的偏见检测。

Jun, 2024

新闻分析中的点点滴滴：媒体偏见与框架的跨学科调查

新闻报道中的偏见表现和影响是社会科学的核心主题，近年来在自然语言处理领域受到了越来越多的关注。本研究综述了社会科学的方法，并将其与自然语言处理领域中用于分析媒体偏见的典型任务表述、方法和评估指标进行了对比。我们讨论了开放性问题，并提出了可能的研究方向，以填补理论与预测模型之间及其评估之间的差距。这些包括模型透明度、考虑文档外部信息以及跨文档推理而非单一标签的分配。

Sep, 2023

利用引线偏差进行零 - shot 抽象新闻摘要

本文提出了一种利用新闻报道中引文偏见进行先训练的方法，以预测文章中的前导句。作者把这种方法应用到 BART 和 T5 模型中，为领域适应打下基础，并通过六个基准数据集的实验表明，这种方法可以显著提高摘要质量，取得了零调整的新闻摘要的最新成果。

Dec, 2019

通过比较实体相关信息来源，实现新闻覆盖中选择偏差的语料库规模发现

本篇论文探讨了如何建立可扩展 NLP 系统来直接从海量新闻语料库中发现媒体选择偏差模式的挑战，并针对新闻源的意识形态进行了实证研究，通过无监督的学习方法来捕捉新闻语料库中的媒体选择倾向，为未来的媒体选择偏差研究提供了启示。

Apr, 2023

新闻中的情感分析

这篇论文研究了新闻文章情感分析的不同点，并且提出了三个需要解决的子任务，同时尝试从新闻文章中分离出正负面情感并挖掘其中的实体，最终得到的实验结果表明，忽略专业领域的词汇能够在新闻观点挖掘的任务中产生更好的效果。

Sep, 2013

新闻中的目标感知背景政治偏见检测

媒体偏见检测需要综合多个新闻来源的信息，以句子级别的政治偏见检测为例，通过考虑上下文中的偏见而进行的任务被证明是一项具有挑战性的任务。我们提出了一种更加小心地搜索上下文的技术，采用偏见敏感和目标感知的数据增强方法，通过与 BERT 等预训练模型的结合，在著名的 BASIL 数据集上进行了综合实验，取得了 58.15 的 F1 得分，明显优于先前方法的最新偏见检测任务。

Oct, 2023