DMRST：面向文档级多语言 RST 篇章分割和解析的联合框架

EMNLPOct, 2021

DMRST：面向文档级多语言 RST 篇章分割和解析的联合框架

DMRST: A Joint Framework for Document-Level Multilingual RST Discourse Segmentation and Parsing

Zhengyuan Liu, Ke Shi, Nancy F. Chen

TL;DR本文提出一个基于文档级别的多语言 RST 话语分析框架，该框架将 EDU 分割和话语树解析结合在一起，并且引入了跨语言翻译增强策略，以支持多语言解析并改善其领域通用性，实验结果表明，该模型在所有子任务中实现了文档级别多语言 RST 解析的最新性能。

Abstract

text discourse parsing weighs importantly in understanding information flow and argumentative structure in natural language, making it beneficial for downstream tasks. While previous work significantly improves the performance of →

text discourse parsing rst multilingual parsing edu segmentation document-level

发现论文，激发创造

多语言神经 RST 话语分析

研究了通过利用多语言向量表示和采用源内容的分段级别翻译建立神经交叉语言篇章分析器的两种方法，并表明这两种方法即使在有限的训练数据下也有效，并且在所有子任务上实现了跨语言、文档级的篇章分析性能。

Dec, 2020

跨语言 RST 篇章分析

本文针对英语 RST 话语树库，提出了跨语言话语分析方法，并在西班牙语、德语、巴斯克语、荷兰语和巴西葡萄牙语中实验。该方法简单易行且有效，可以帮助更好地理解文件中的信息流和论证结构。

Jan, 2017

从零开始的 RST 语法分析

本文提出了一种基于分裂决策的顶级自上而下的端到端文档级修辞结构理论（RST）框架下的论述解析方式，并采用 seq2seq 网络建模分离决策，无需依赖分段，融合高分树搜索算法得到最佳树结构，实验结果表明该解析器在端对端解析和使用黄金分段分析方面表现出色，且无需使用手工特征，速度更快，易于适应新的语言和领域。

May, 2021

一种用于句子级别语篇解析的统一线性时间框架

使用神经框架和指针网络，基于 Rhetorical Structure Theory (RST) 的句子级别的语篇分析提出了一种高效的分析方法。基于分段器和分析器的性能表现显示出此方法具有优势且逼近人类认知水平。

May, 2019

以文档级内容结构为导向的 RST 风格的篇章解析

基于修辞结构理论的话语解析（RST-DP）探索了子句、句子和大文本跨度如何组成整个话语，并将修辞结构呈现为一个分层树。现有的 RST 解析流水线在构建修辞结构时缺乏对文档级内容结构的了解，导致在预测大文本跨度的话语关系时性能相对较低。为了识别高级内容相关信息在促进话语关系识别方面的价值，我们提出了一种新颖的 RST-DP 流水线，该流水线结合了从新闻话语建模任务中得出的具有结构意识的新闻内容句子表示。通过仅添加了少量的附加层，这个增强的流水线在各种 RST 解析指标上表现出了很有前景的性能。

Sep, 2023

快速修辞结构理论篇章分析

本文描述了一种 RST 分割和解析系统，该系统可以快速、稳健地处理新闻文章或文章等短文档，并将各种先前工作的模型和特征集进行了适应，其准确性接近于最先进的水平。

May, 2015

发掘神经言语解析器的能力 —— 使用大规模预训练的上下文和结构感知方法

这篇论文提出了一个简单但高精度的 RST 语篇分析器，采用最近的上下文语言模型，表现出两个重要数据集，RST-DT 和 Instr-DT 的最新技术性能。研究人员还表明，在最近可用的大规模 “银标准” 话语树库 MEGA-DT 上预训练我们的分析器可以提供更大的性能改进，这为话语分析领域提供了一种新的有前途的研究方向。

Nov, 2020

一种自上而下的神经结构，用于文本级别的议论语言结构分析

本文提出一种基于自上而下的神经网络结构，将话语的分层结构解析为分裂点排序任务，并在英文 RST-DT 语料库和中文 CDTB 语料库上进行实验，证明了该方法在文本级语篇分析中的高效性。

May, 2020

可扩展遥感情感监督数据生成的具有结构和核心性的 MEGA RST 话语树库

本研究提出了一种新的可扩展的方法用于自动生成论述树库，同时发布了一个新的大规模的语料库 MEGA-DT，通过多个数据集的实验表明，在 MEGA-DT 树库训练出的论述解析器相对于训练在人工注释语料库上的解析器表现得到了显著提升。

Nov, 2020

MACT: 跨语言模型无关的话语结构解析训练

通过引入跨语言训练策略，深入分析和改进基于 Discourse Representation Structure（DRS）的语义表示分析模型，在英语、德语、意大利语和荷兰语的标准基准测试中取得了最先进的结果，并为未来的 DRS 分析研究提供了深入的见解。

Jun, 2024