- 利用 NLI 探索事实蕴含关系:新闻媒体研究
探索事实性与自然语言推理之间的关系,并引入 FactRel 注释方案来模拟事实性推理,分析表明,事实性支持对和事实性削弱对的大部分情况不构成自然语言推理的蕴含或矛盾关系,这表明事实关系更适合分析媒体话语;在新数据集上进行了对比分类模型的实验 - EcoVerse: 一个用于生态相关分类、环境影响分析和立场检测的标注推特数据集
Anthropogenic ecological crisis has prompted the NLP community to address the lack of research on environmental topics, - COLING条款与条件合同中相关条款的注释与分类
该研究使用新的注释方案,将条款与条件合同中的不同类型从句子进行分类,旨在帮助法律专家快速识别和评估此类型法律文件中的问题。研究结果表明,通过在多语言 T5 和两种意大利 BERT 模型上进行少样本预训练,可以实现对分类的自动化,精度在 0. - ACL多维文献探索的文本摘要进展
提供了 TL;DR Progress 工具,用于研究神经文本摘要的文献。该工具通过一个综合的注释方案,对 514 篇论文进行了组织,并实现了细粒度、多方位的检索。每篇论文都经过手工注释,捕捉了评估指标、质量维度、学习范式、解决的挑战、数据集 - 点指上行视频目标分割
提出了一种基于稀疏点注释方案的新型 Point-VOS 任务和标注机制,通过基于伪掩码的训练可以使现有的 VOS 方法在性能上接近全监督的表现,并且该数据可用于改进视觉和语言相关的模型。
- 沃尔兹在《国际政治的新兴结构》中的论证
我们提出了一种用于国际关系理论学术文章的论证和领域特定方面的注释方案。我们在论证层面上确定了主张和支持 / 攻击关系。在领域层面上,我们模拟以理论和数据相关陈述的方式来表达讨论内容。我们对 Waltz 1993 年的关于结构现实主义的文本进 - EMNLPTIMELINE:新闻文章中支持自动排序事件的时间关系的详尽注释
该研究论文介绍了一种新的标注方案,以解决现有时间关系注释新闻数据集中存在的问题,并自动化了标注过程,从而减少了时间和人力成本。该论文还报告了基于新语料库进行训练和评估基线时间关系提取模型的结果,并与广泛使用的 MATRES 语料库的结果进行 - 从弱监督的注释中学习视频物体指代分割
基于一种新的注释方案,我们提出了一种弱监督的方法,通过语言引导的动态过滤器和双层对比学习方法,实现了在不要求密集标注的情况下取得了有竞争力的性能。
- CGELBank 注释手册 v1.0
CGELBank 是基于从《剑桥英语语法》中推导出的一种英语句法形式主义的树库和相关工具,本文概述了 CGELBank 注释方案的特殊性。
- 自然语言处理用于情感认知分析
本研究介绍一种新的情感分析标注方法,提出一种基于自传故事纪录的情感分析的数据集,探索了使用基于规则的自动标注方法来标注情感及其语义角色,以便教练识别相关方面,并探讨了基于图结构的情感分析的未来方向。
- 了解人际冲突类型及其对感知分类的影响
通过建立新的注释方案并发布新数据集,我们构建了一个分类器来预测个体在特定情境中对行为的观感是否正确,并研究了人与作者之间关系对冲突内容的影响,这对于理解冲突和社交规范具有重要意义。
- 法院判决中的法律论点挖掘
该研究探讨了法律文本中的论点自动提取与语义分析方法,采用基于欧洲人权法院纪录的一种新的注释方案,提出了一种改进的模型,能够更加准确地对法律审判过程中的论点进行自动化提取与分类。
- EMNLP重访 DocRED -- 在关系抽取中解决假阴性问题
本文针对 DocRED 数据集中占主导地位的漏报问题进行了研究,并通过重新注释数据集来修复该问题,重新命名为 Re-DocRED 数据集,同时实验结果表明使用 Re-DocRED 数据集进行训练和评估可以获得 13 个 F1 分数的性能提升 - 针对 “假新闻” 的注释方案重建及日本假新闻数据集
研究假新闻检测任务的众多假新闻数据集基本关注新闻的真实性,但这样单方面是无法解释 “假新闻” 的,作者提出了基于细节调查的新注释方案,以细分标注的方式捕获假新闻的多个方面,进一步对其进行深入理解和研究,并构建并发布了第一个日本假新闻数据集。
- ACL支持学生认知和情感共情写作
本文介绍在商业模型的同伴评审中捕捉情感和认知共情的注释方法,包括三种类型的评审组件,建议注释计划成功地引导注释器达成了大致一致的结果。我们训练了预测模型以检测注释的共情结构,并将其嵌入支持学生独立接收共情反馈的自适应写作支持系统中。我们还评 - 对抗性自然语言推理数据集分析
本文提出了一种精细注释 Adversarial NLI 的方法,通过分析其数据集中不同方面的推理并使用手工编码,回答了一些问题,如哪种推理类型最常见,哪种模型在每种推理类型上的表现最好等,并希望这些注释可以使得对于 ANLI 训练的模型进行 - 对仇恨言论进行注解:MaNeCo 语料库及来自关键话语分析的一些输入
本研究提出了一种新颖的方案用于 Web 2.0 评论集中仇恨言论的注释,提出一个多层注释方案,并在 MaNeCo 语料库上进行了试验,显示出更高的注释者间协议一致性。
- 分类建设性评论
本文介绍了 C3(Constructive Comments Corpus)语料库,包含 12,000 条经过注释的新闻评论,旨在帮助构建新的在线社区工具,以提高其讨论质量。通过定义建设性评论为对会话有所贡献的高质量评论,并通过定义建设性子 - 基于用户满意度评估的领域无关的对话质量评估
该研究提出了一种新的 Response Quality 标注方案,基于此开发了一种新的以轮为单位的用户满意度量。使用五个新的与领域无关的特征集和六种机器学习模型来估算新的满意度量,方法显著提高了模型性能和泛化能力。
- ACL语义约束的多层标注:共指案例
本文提出一种基于 Universal Conceptual Cognitive Annotation 的共指注释方案,将谓语 - 论元结构作为实体和事件提及的基础,旨在解决现有方案面临的一些挑战,并考虑了与其他方案的比较。