通过对比学习检测新闻标题中的上下文引用

ACLFeb, 2023

通过对比学习检测新闻标题中的上下文引用

Detecting Contextomized Quotes in News Headlines by Contrastive Learning

Seonyeong Song, Hyeonho Song, Kunwoo Park, Jiyoung Han, Meeyoung Cha

TL;DRQuoteCSE 是一种对新闻文章引用的嵌入式对比学习框架，它基于正负样本的域驱动来识别新闻标题中的语境引用，从而提高报导的可信度。

Abstract

quotes are critical for establishing credibility in news articles. A direct quote enclosed in quotation marks has a strong visual appeal a

news quotes credibility journalistic practice contextomization

发现论文，激发创造

基于上下文的引文建议

我们提出了一种新颖的上下文感知引用推荐系统，使用作者已经撰写的内容从给定的源文档中生成可引用的段落和标记跨度的排名列表，通过在演讲转录和新闻文章的集合上进行实验，评估了模型的段落排名和跨度预测性能。

May, 2020

对比学习增强的作者风格标题生成

本文提出了一种名为 CLH3G 的新型 Seq2Seq 模型，该模型可以利用作者过去写过的文章的历史标题，以改善当前文章的标题生成。通过考虑历史标题，我们可以将作者的风格特征融入到我们的模型中，生成既适合文章又与作者的风格一致的标题。我们进一步引入了一种基于对比学习的编码器辅助任务来高效地学习作者的风格特征，以及两种使用学习的风格特征来指导指针和解码器的方法。实验结果表明，相同作者的历史标题可以显著改善标题生成，并且对比学习模块和两种风格特征融合方法可以进一步提高性能。

Nov, 2022

Quote Erat Demonstrandum: 一个用于浏览 Quotebank 语料库的 Web 界面

该论文介绍了一个自适应的 Web 界面，用于搜索新闻中的名言佳句，它们提供了一种最直接，最不被过滤的信息传播路径，是记者和研究人员的宝贵资源。

Jul, 2022

在线对话学习引用的连续性：话题、互动和查询

本研究探讨了在线对话中自动引用生成的一些特点，基于对话历史、语言一致性的相互作用，以及与查询转的现有内容的一致性等方面对引文的语境一致性进行了捕捉，并采用编码 - 解码神经框架通过语言生成来继续语境，实现引文的自动化。通过英文和中文两个大规模数据集进行实验，结果表明我们的引文生成模型优于现有的最先进模型。进一步的分析显示，主题、交互和查询的一致性都有助于学习如何在在线对话中引用。

Jun, 2021

新闻图片标题生成的视觉感知上下文建模

新闻图像字幕生成的自动化方法通过设计面部命名模块和检索策略以优化视觉信息处理，并超越之前的最佳性能表现。

Aug, 2023

Good News, Everyone! 基于语境的实体感知新闻图片标题生成

该论文提出了一种新的图像描述方法，利用新闻文章中的上下文信息，动态扩展输出词典，通过可视化线索有选择性地从文章中提取信息，能够生成探究场景的描述，同时发表了最大的新闻图像字幕数据集 “GoodNews”，并展示了最先进的结果。

Apr, 2019

通过对比学习和语句图网络建模多层上下文进行信息偏倚检测

本文探讨了如何利用多种不同级别的语境来检测新闻文章中的信息偏见。通过使用对比学习和句子图形以及 GAT 编码三种不同程度的语境，成功地在不同的事件中组成对比三元组和构建句子图形。实验证明，对比学习和句子图形有效地吸收了不同程度的上下文，显著优于当前 SOTA 模型在句子级情感分析方面的表现。

Jan, 2022

通过反事实文本引导的对比语言 - 图像预训练理解新闻缩略图代表性

本文研究了新闻缩略图的代表性问题，重点关注新闻图像是否能够准确地代表新闻文本的主题。我们提出了一个手动标注的新闻缩略图和文本对的数据集 NewsTT，并发现预训练的视觉和语言模型在这个任务中遇到困难。为了弥补这一差距，我们提出了 CFT-CLIP，一个反事实文本引导的对比语言 - 图像预训练框架。通过对比新闻文本与其替代实体的反事实文本，我们提出该框架可以增强跨模态匹配能力。使用 NewsTT 数据集的评估实验证明 CFT-CLIP 比预训练模型（如 CLIP 和 BLIP-2）性能更好。本文的代码和数据将在接受后向公众开放。

Feb, 2024

基于引文提取和归属的新闻数据集，用于事实核查专家推荐

本论文提出了一种基于相关性的新闻专家选择任务，通过构建一个包括 24,031 对引语 - 发言人的新闻引文数据集，采用基于 BERT 的问答模型对其进行自动抽取，然后通过文件检索任务鉴定信任专家。实验证明，与专家检索相比，文件检索可以更有效地识别与特定新闻主题相关的专家。

May, 2023

CofeNet: 复杂引语提取的上下文和前标签增强网络

本文提出了上下文和先前标签增强网络 (CofeNet)，针对文本中具有不同长度和复杂结构的引语进行提取，相比于基于规则和序列标注模型的方法，CofeNet 能够在 PolNeAR、Riqua 和 PoliticsZH 数据集上取得最先进的性能。

Sep, 2022