依存架构统一话语资源

Jan, 2021

Unifying Discourse Resources with Dependency Framework

Yi Cheng, Sujian Li, Yueyuan Li

TL;DR本文旨在建立一个语义依赖关系框架，并研究基于此框架的语料库进行多元语言分析，为依步性分析提供数据基础。

Abstract

For text-level discourse analysis, there are various discourse schemes but relatively few labeled data, because discourse research is still immature and it is labor-intensive to annotate the inner logic of a text. In this paper, we attempt to unify multiple →

text-level discourse analysis chinese discourse corpora dependency framework benchmark dependency parsers performance

发现论文，激发创造

走向话语注释框架的统一化

通过自动化手段实现不同注释框架的统一，对结构复杂性以及多任务学习和图形模型的应用进行探索和评估。

Apr, 2022

不同语篇注释框架之间的自动对齐

利用标签锚定对比学习方法，通过学习标签嵌入来映射不同框架中的语篇关系。

Mar, 2024

使用上下文表示改进话语依存分析

本研究提出了一种基于 transformers 的新方法，通过对不同级别单元的上下文化表示进行编码，动态捕捉对话依赖分析所需的信息，并将对话关系识别视为序列标记任务

May, 2022

汉语对话级依存句法分析的初步研究

研究了汉语对话级别的依存分析，利用句法依存和修辞结构理论的思想，开发了一个人工注释的高质量语料库，探索了零样本和少样本场景，并考虑采用基于信号检测的方法将先前存在的句法依存转化为单元话语之间的未见依存的场景。通过单视图和多视图数据选择来获取可靠的伪标签实例，实验结果表明了这些基线的有效性。同时，我们还讨论了有关数据集和方法的几个关键点。

May, 2023

针对 TED 演讲的浅层言语注释

本文介绍了一种基于 Penn Discourse TreeBank 标注语言相关特征的新资源，通过对 TED Talks 进行标注，为中英文翻译和语言技术的发展做出了贡献。该资源注重对计划性口语独白的篇章层面语言特征的标注，而不仅仅局限于书面语，基于多位标注者的协商，该标注方案的可靠性得到了证实。

Mar, 2020

通过问题和回答进行话语分析：解析讨论中问题的依存结构

本文介绍了一种自动语篇处理方法 ——Questions Under Discussion（QUD），采用了一种新的语言框架，通过大数据集训练 QUD 解析器从而可以获得强大的性能，同时通过 QUD 分析可以实现文档简化。

Oct, 2022

口语对话系统的依存句法分析

本研究提出了一种名为 SCUD 的新的语言依存注释标准，并提供了 ConvBank 数据集，以用于在人机对话方面训练依存句法分析模型。实验表明，将模型预训练于公共数据集并在 ConvBank 数据上进行微调可以取得最好的结果，达到了 85.05％的未标注和 77.82％的标注连接准确率。

Sep, 2019

在段落中建模话语单元的相互依赖关系以提高隐含话语关系分类能力

通过构建神经网络模型，模拟句子和段落之间的相互依赖和连续性，并能够连续预测段落中的语篇关系，从而提高隐含的语篇关系分类的效果，并在 PDTB 的基准语料库上取得了最佳性能。

Apr, 2018

注入话语依赖性以提高主题分割

我们提出了一种注入了句际依赖结构的话语感知神经主题分割模型，以更好地利用句子之间的主题一致性进行主题边界分割预测，并在英文评估数据集上进行实证研究表明，我们的策略显著提高了神经主题分割器在域内和域外数据上的性能。

Sep, 2022

汉语话语注释参考手册

该文提供了关于中文语篇结构理论的标注的指南，并包含预处理、分割和定义篇章关系的步骤和示例，旨在促进 RST 框架的跨语言应用。

Oct, 2022