血红满地,头条报道:计算方法报道洛杉矶的犯罪
本文提供了一种基于弱监督框架和领域知识的自动检测本地新闻的集成管道,能够识别多语言环境下的本地新闻,并在真实数据集上展现出更高的准确性和召回率。
Jan, 2023
本文研究了超过 150 篇文章,探讨了机器学习和深度学习算法在犯罪预测方面的应用,分析了犯罪预测所需的数据集和机器学习和深度学习的主要方法,并提出了可用于提高预测准确性的因素和未来研究方向,为犯罪预测领域的研究人员提供有价值的参考。
Mar, 2023
本文提出了一种利用新闻报道中引文偏见进行先训练的方法,以预测文章中的前导句。作者把这种方法应用到 BART 和 T5 模型中,为领域适应打下基础,并通过六个基准数据集的实验表明,这种方法可以显著提高摘要质量,取得了零调整的新闻摘要的最新成果。
Dec, 2019
科技新闻记者面临着工作量增加、资源减少和科学出版生态系统扩大等方面的挑战。在这种背景下,我们探索了计算方法来帮助记者在时间效率和自主性方面发现新闻,并通过一个交互工具进行了原型设计来更好地理解这种工具可能如何提供效益或在更广泛的范围内塑造专业科技新闻记者的实践。我们的研究结果突出了科技新闻记者自主权、背景和责任等核心问题,这些工具可以影响并在设计中加以考虑。基于此,我们提出了增加和更长期用户自主权的设计机会;结合上下文、个人和协作性的新闻价值观念;以及利用灵活的界面和生成模型的方法。总体而言,我们的研究结果为计算新闻发现工具的社会技术系统提供了更丰富的视角,并建议改进这些工具以更好地支持科技新闻记者的实践。
Nov, 2023
记者在使用大型语言模型(LLMs)时存在与 AI 的互动,而研究揭示了记者如何向 LLM 提供敏感材料并以有限的干预发表机器生成的文章,因此呼吁进一步探讨 AI 的负责任使用以及在新闻环境中使用 LLMs 的明确准则和最佳实践。
Jun, 2024
本文提出两种技术来使系统对文章不同部分的重要性敏感,一种是使用随机排序的句子进行预训练,一种是使用基于 ROUGE 的 Auxiliary Loss 来分散整个文档中的重要性得分,这些技术可以显着提高基于强化学习的抽取系统的性能。
Sep, 2019
该研究提出了一种基于注意力机制的神经网络方法来共同模拟指控预测任务和相关法律条款提取任务,实验结果表明,相关条款可以清晰地改善指控预测结果,该模型可以有效地预测不同表达风格的案件指控。
Jul, 2017
本研究定义了一个新的任务 “责任关系提取”,并构建了一个新的数据集,通过诸如 BiLSTM 网络的方法,利用 GloVe 和 ELMo 这样的大型无监督模型,实现了 US 金融危机期间出现的责任关系的自动提取和有效性检验,其 F1 得分最高达到 70%,是社会科学家更高效地提取责任关系的有用工具。
Apr, 2019
该研究基于卷积神经网络开发了一个标题分类器,主要通过调查标题的词语分割、词性标注和情感特征等关键因素,以确定新闻文章的可信度,并将这些特征集成到分类模型中。经过实验证明,该模型的准确度可达到 93.99%。
Apr, 2022