DiscSense: 议态词自动语义分析

Jun, 2020

DiscSense: Automated Semantic Analysis of Discourse Markers

Damien Sileo, Tim Van de Cruys, Camille Pradel, Philippe Muller

TL;DR使用训练预测语篇标记的模型预测已知语义关系的句子对之间可信的标记，从而在现有分类数据集上提供语篇标记与语义关系之间的自动化底层特征化。

Abstract

discourse markers ({\it by contrast}, {\it happily}, etc.) are words or phrases that are used to signal semantic and/or pragmatic relationships between clauses or sentences. Recent work has fruitfully explored the prediction of →

discourse markers semantic relations classification datasets sentence representations discsense

发现论文，激发创造

挖掘话语标记以进行无监督句子表示学习

本研究提出了一种方法，利用未标注的语料库中的关于话语标记的信息，自动发现带有相关话语标记的句子对，构建了一个包含 174 个话语标记的数据集，并用于学习迁移句子嵌入。尽管语句表示学习通过话语标记预测取得了跨转移任务的最先进结果，但仍存在进一步提高的空间，因为仍不清楚我们的模型是否利用了句子间的语义关系。

Mar, 2019

有歧义的语篇标记和交织关系的分布式标记表示

通过学习分布式标记表示以及潜在的语篇感，实现了对句子对之间的标记和语段信息的联系，具备自动学习和解释性强的特点，并在隐式语篇关系识别任务中达到了 SOTA 效果。

Jun, 2023

讲话标记可以增强情感分析语言模型

本文研究使用情感搭载的话语标记产生大规模弱标记数据并利用此数据训练与情感分析更好契合的连续预训练模型，以提高零标记和少样本情况下的性能表现，并在多项基准数据集上进行了广泛的实验，包括金融领域。

Jan, 2022

跨文本类型论证挖掘：语言模型自动填补缺失的话语标记？

为了提高不同类型文本中的 Argument Mining 系统的鲁棒性，我们提出了自动使用连贯性标记来增加输入文本的方法，以便明确标记所有关系，并发现即使是现成的最流行的语言模型在这项任务上也会失败。

Jun, 2023

预训练的语句嵌入用于隐式语篇关系分类

本文针对隐含的语篇关系进行了意义预测，利用预训练的句子嵌入作为神经网络基础表示，分别使用监督学习和预训练编码技术 - SkipThought，Sent2vec 和 Infersent 进行实验，并证实两种方法可以相互补充，结合模型可以显著提高模型性能。

Oct, 2022

自动预测话语连接词

本文提出了用于生成连贯和流畅的语篇的方法，并介绍了预测话语连接词的任务以及相应的数据集和评估机制，同时使用可分解注意力模型进行任务的自动预测并发现其 F1 得分高于人类评估者，但在特定情况下，人类评估者仍然优于该模型。

Feb, 2017

通过利用感知关系的层次结构促进话语关系意义的对比学习

利用层次化结构和对比学习技术来提高隐式篇章关系识别的性能。

Jan, 2023

不同语篇注释框架之间的自动对齐

利用标签锚定对比学习方法，通过学习标签嵌入来映射不同框架中的语篇关系。

Mar, 2024

基于神经网络的篇章关系标记检测方法

本研究使用了数据驱动方法和基于远程监督的神经网络来检测文章中的话语关系信号，开发了一个名为 “Delta s” 的衡量信号强度的度量，该度量通过上下文词嵌入表示每个单词对于关系识别的积极或消极贡献，通过对英文语料的分析，研究了该度量的可靠性，以及其与人类判断的重叠和差异，并探讨了神经模型在自动话语关系分类中所需的特征。

Jan, 2020

DisSent: 显式语篇关系的句子表征学习

利用依存分析和基于规则的指标，我们能够通过利用显式的篇章关系来筛选高质量的句子关系任务，从而得出高质量的句子嵌入向量及用作 BERT 等更大型模型的监督微调数据集。

Oct, 2017