DiscSense: 议态词自动语义分析
本研究提出了一种方法,利用未标注的语料库中的关于话语标记的信息,自动发现带有相关话语标记的句子对,构建了一个包含 174 个话语标记的数据集,并用于学习迁移句子嵌入。尽管语句表示学习通过话语标记预测取得了跨转移任务的最先进结果,但仍存在进一步提高的空间,因为仍不清楚我们的模型是否利用了句子间的语义关系。
Mar, 2019
通过学习分布式标记表示以及潜在的语篇感,实现了对句子对之间的标记和语段信息的联系,具备自动学习和解释性强的特点,并在隐式语篇关系识别任务中达到了 SOTA 效果。
Jun, 2023
本文研究使用情感搭载的话语标记产生大规模弱标记数据并利用此数据训练与情感分析更好契合的连续预训练模型,以提高零标记和少样本情况下的性能表现,并在多项基准数据集上进行了广泛的实验,包括金融领域。
Jan, 2022
为了提高不同类型文本中的 Argument Mining 系统的鲁棒性,我们提出了自动使用连贯性标记来增加输入文本的方法,以便明确标记所有关系,并发现即使是现成的最流行的语言模型在这项任务上也会失败。
Jun, 2023
本文针对隐含的语篇关系进行了意义预测,利用预训练的句子嵌入作为神经网络基础表示,分别使用监督学习和预训练编码技术 - SkipThought,Sent2vec 和 Infersent 进行实验,并证实两种方法可以相互补充,结合模型可以显著提高模型性能。
Oct, 2022
本文提出了用于生成连贯和流畅的语篇的方法,并介绍了预测话语连接词的任务以及相应的数据集和评估机制,同时使用可分解注意力模型进行任务的自动预测并发现其 F1 得分高于人类评估者,但在特定情况下,人类评估者仍然优于该模型。
Feb, 2017
本研究使用了数据驱动方法和基于远程监督的神经网络来检测文章中的话语关系信号,开发了一个名为 “Delta s” 的衡量信号强度的度量,该度量通过上下文词嵌入表示每个单词对于关系识别的积极或消极贡献,通过对英文语料的分析,研究了该度量的可靠性,以及其与人类判断的重叠和差异,并探讨了神经模型在自动话语关系分类中所需的特征。
Jan, 2020
利用依存分析和基于规则的指标,我们能够通过利用显式的篇章关系来筛选高质量的句子关系任务,从而得出高质量的句子嵌入向量及用作 BERT 等更大型模型的监督微调数据集。
Oct, 2017