本文介绍了自动评论任务的提出和拥有数百万真实评论和人工标注的子集的大规模中文数据集,并开发了考虑评论质量与人类评估相关性的自动度量标准。
May, 2018
本研究提出了基于图到序列模型的评论生成方法,该模型将输入的新闻文章作为一个话题交互图进行建模,以更好地理解文章的内部结构和主题之间的联系,从而比传统编码器-解码器模型在在线新闻平台中为用户提供更连贯和有用的评论。
Jun, 2019
本文探讨了自然语言生成的技术,并提出了基于“读-关注-评价”流程的新闻评论自动化生成方法,通过阅读网络和生成网络来理解新闻文章并生成评论。实验结果表明,该模型在自动评估和人类判断方面明显优于现有方法。
Sep, 2019
通过探究四种不同的上下文对英语新闻文章中的信息偏误进行分类,我们发现将事件上下文整合在一起可以提高分类的性能并且可以更好地减少错误率。
Dec, 2020
提出了一种针对评论内容的自动生成模型,采用读者感知的主题建模和显著信息检测框架,生成多样化和有信息量的评论,并在三个数据集上取得了优于现有基线方法的结果。
Feb, 2021
通过“事实性”和“形式性”两个维度,提出了一个用于描述新闻类型的非离散框架,并提供了两个计算模型以自动化地分析新闻语句。这样的预测可用于在该框架内定位新闻项目,帮助更深入地理解新闻类型的演变。
Dec, 2022
该研究利用构建的数据集和模型分析信息源在新闻报道中的使用,提出了新的任务——信息源预测,并展示了模型在这一任务上的良好表现。该成果为新闻报道领域的内部结构探索和规划性语言生成提供了重要的支持,也为辅助新闻工作者提供源推荐系统提供了重要的思路和实践基础。
May, 2023
新闻报道中的偏见表现和影响是社会科学的核心主题,近年来在自然语言处理领域受到了越来越多的关注。本研究综述了社会科学的方法,并将其与自然语言处理领域中用于分析媒体偏见的典型任务表述、方法和评估指标进行了对比。我们讨论了开放性问题,并提出了可能的研究方向,以填补理论与预测模型之间及其评估之间的差距。这些包括模型透明度、考虑文档外部信息以及跨文档推理而非单一标签的分配。
Sep, 2023
利用新闻标题产生情感解释,并使用生成的情感解释进行情感分类,证明了中间的自由文本解释在标题情感预测任务中的价值。
Jul, 2024
本研究探讨了媒体从业人员与读者对于新闻相关用户生成内容的期望差异,称为“新闻评论差距”。通过分析120万个评论,研究发现记者偏好积极、及时、复杂的评论,而读者倾向于来自精英作者的内容相关评论。引入的功能导向排名效用指标(FORUM)揭示了不同排名算法在情感、话题相关性、词汇多样性和可读性上的显著差异,强调了记者在在线讨论中的重要影响。
Aug, 2024