血红满地，头条报道：计算方法报道洛杉矶的犯罪

Jun, 2022

血红满地，头条报道：计算方法报道洛杉矶的犯罪

If it Bleeds, it Leads: A Computational Approach to Covering Crime in Los Angeles

Alexander Spangher, Divya Choudhary

TL;DR该研究提出了一种机器辅助系统，使用概率图模型和规则系统来生成文章结构和提要段落，以覆盖洛杉矶的犯罪报道，旨在提高新闻报道的效率和准确性。

Abstract

Developing and improving computational approaches to covering news can increase journalistic output and improve the way stories are covered. In this work we approach the problem of covering →

computational approaches journalistic output crime stories los angeles probabilistic graphical model

发现论文，激发创造

弱监督方法检测当地新闻，探究社区发生的事件

本文提供了一种基于弱监督框架和领域知识的自动检测本地新闻的集成管道，能够识别多语言环境下的本地新闻，并在真实数据集上展现出更高的准确性和召回率。

Jan, 2023

利用机器学习和深度学习进行犯罪预测：系统综述与未来方向

本文研究了超过 150 篇文章，探讨了机器学习和深度学习算法在犯罪预测方面的应用，分析了犯罪预测所需的数据集和机器学习和深度学习的主要方法，并提出了可用于提高预测准确性的因素和未来研究方向，为犯罪预测领域的研究人员提供有价值的参考。

Mar, 2023

利用引线偏差进行零 - shot 抽象新闻摘要

本文提出了一种利用新闻报道中引文偏见进行先训练的方法，以预测文章中的前导句。作者把这种方法应用到 BART 和 T5 模型中，为领域适应打下基础，并通过六个基准数据集的实验表明，这种方法可以显著提高摘要质量，取得了零调整的新闻摘要的最新成果。

Dec, 2019

生成新闻故事的代表性标题

试图在不使用人工标注的情况下通过在不同级别上同时使用多个类型的未标注语料库和自投票方法对新闻报道进行标题生成的研究。

Jan, 2020

科学新闻领域中对计算机新闻发现工具的实践理解

科技新闻记者面临着工作量增加、资源减少和科学出版生态系统扩大等方面的挑战。在这种背景下，我们探索了计算方法来帮助记者在时间效率和自主性方面发现新闻，并通过一个交互工具进行了原型设计来更好地理解这种工具可能如何提供效益或在更广泛的范围内塑造专业科技新闻记者的实践。我们的研究结果突出了科技新闻记者自主权、背景和责任等核心问题，这些工具可以影响并在设计中加以考虑。基于此，我们提出了增加和更长期用户自主权的设计机会；结合上下文、个人和协作性的新闻价值观念；以及利用灵活的界面和生成模型的方法。总体而言，我们的研究结果为计算新闻发现工具的社会技术系统提供了更丰富的视角，并建议改进这些工具以更好地支持科技新闻记者的实践。

Nov, 2023

突发新闻：生成人工智能在新闻报道中的案例研究

记者在使用大型语言模型（LLMs）时存在与 AI 的互动，而研究揭示了记者如何向 LLM 提供敏感材料并以有限的干预发表机器生成的文章，因此呼吁进一步探讨 AI 的负责任使用以及在新闻环境中使用 LLMs 的明确准则和最佳实践。

Jun, 2024

通过多阶段训练和辅助损失对抗新闻摘要中的主观倾向

本文提出两种技术来使系统对文章不同部分的重要性敏感，一种是使用随机排序的句子进行预训练，一种是使用基于 ROUGE 的 Auxiliary Loss 来分散整个文档中的重要性得分，这些技术可以显着提高基于强化学习的抽取系统的性能。

Sep, 2019

利用法律基础学习预测刑事案件的指控

该研究提出了一种基于注意力机制的神经网络方法来共同模拟指控预测任务和相关法律条款提取任务，实验结果表明，相关条款可以清晰地改善指控预测结果，该模型可以有效地预测不同表达风格的案件指控。

Jul, 2017

危机中谁指责了谁？使用神经网络从新闻文章中检测指责关系

本研究定义了一个新的任务 “责任关系提取”，并构建了一个新的数据集，通过诸如 BiLSTM 网络的方法，利用 GloVe 和 ELMo 这样的大型无监督模型，实现了 US 金融危机期间出现的责任关系的自动提取和有效性检验，其 F1 得分最高达到 70％，是社会科学家更高效地提取责任关系的有用工具。

Apr, 2019

标题诊断：内容农场标题的操纵

该研究基于卷积神经网络开发了一个标题分类器，主要通过调查标题的词语分割、词性标注和情感特征等关键因素，以确定新闻文章的可信度，并将这些特征集成到分类模型中。经过实验证明，该模型的准确度可达到 93.99%。

Apr, 2022