快速修辞结构理论篇章分析

May, 2015

Fast Rhetorical Structure Theory Discourse Parsing

Michael Heilman, Kenji Sagae

TL;DR本文描述了一种 RST 分割和解析系统，该系统可以快速、稳健地处理新闻文章或文章等短文档，并将各种先前工作的模型和特征集进行了适应，其准确性接近于最先进的水平。

Abstract

In recent years, There has been a variety of research on discourse parsing, particularly RST discourse parsing. Most of the recent work on rst pa

discourse parsing rst parsing accuracy efficiency robustness

发现论文，激发创造

以文档级内容结构为导向的 RST 风格的篇章解析

基于修辞结构理论的话语解析（RST-DP）探索了子句、句子和大文本跨度如何组成整个话语，并将修辞结构呈现为一个分层树。现有的 RST 解析流水线在构建修辞结构时缺乏对文档级内容结构的了解，导致在预测大文本跨度的话语关系时性能相对较低。为了识别高级内容相关信息在促进话语关系识别方面的价值，我们提出了一种新颖的 RST-DP 流水线，该流水线结合了从新闻话语建模任务中得出的具有结构意识的新闻内容句子表示。通过仅添加了少量的附加层，这个增强的流水线在各种 RST 解析指标上表现出了很有前景的性能。

Sep, 2023

从零开始的 RST 语法分析

本文提出了一种基于分裂决策的顶级自上而下的端到端文档级修辞结构理论（RST）框架下的论述解析方式，并采用 seq2seq 网络建模分离决策，无需依赖分段，融合高分树搜索算法得到最佳树结构，实验结果表明该解析器在端对端解析和使用黄金分段分析方面表现出色，且无需使用手工特征，速度更快，易于适应新的语言和领域。

May, 2021

一种用于句子级别语篇解析的统一线性时间框架

使用神经框架和指针网络，基于 Rhetorical Structure Theory (RST) 的句子级别的语篇分析提出了一种高效的分析方法。基于分段器和分析器的性能表现显示出此方法具有优势且逼近人类认知水平。

May, 2019

多语言神经 RST 话语分析

研究了通过利用多语言向量表示和采用源内容的分段级别翻译建立神经交叉语言篇章分析器的两种方法，并表明这两种方法即使在有限的训练数据下也有效，并且在所有子任务上实现了跨语言、文档级的篇章分析性能。

Dec, 2020

从 RST 论述分析提升文件级情感分析

通过分析语篇结构中的修辞元素，文献使用的修辞结构理论 (RST) 解析器可以提高情感分析的准确性；该文献使用基于依存关系的位置调整方法和基于 RST 结构的递归神经网络模型分别取得了显著的效果提升。

Sep, 2015

基于神经网络的 RST 方法用于衡量篇章连贯性

利用 Rhetorical Structure Theory (RST) 树和关系对话语连贯性进行评估，表明在分类连贯性方面增加银标准 RST 特征可以提高准确性，我们开发了一个 tree-recursive neural model，即 RST-Recursive，利用了由最先进的 RST 解析器产生的文本 RST 特征。在 Grammarly Corpus for Discourse Coherence (GCDC) 上评估我们的方法，并展示了当与现有先进技术结合使用时，我们可以在此基准测试中实现新的技术水平的准确性。此外，单独部署时，RST-Recursive 具有竞争性的准确性，同时参数减少了 62%。

Sep, 2020

神经生成修辞结构分析

本文提出了第一个用生成模型进行 RST 解析的文档级 RNN 语法，通过一种新的 beam search 算法，在而不展示左分支的偏差下，在未标注和标注的 F1 值上分别提高 6.8 和 2.9，超越了所有不使用额外训练数据的最新复制研究中发布的解析器，并且优于具有相同特征的判别模型 2.6F1 分。

Sep, 2019

DMRST：面向文档级多语言 RST 篇章分割和解析的联合框架

本文提出一个基于文档级别的多语言 RST 话语分析框架，该框架将 EDU 分割和话语树解析结合在一起，并且引入了跨语言翻译增强策略，以支持多语言解析并改善其领域通用性，实验结果表明，该模型在所有子任务中实现了文档级别多语言 RST 解析的最新性能。

Oct, 2021

英语 RST 解析中的难点是什么？通过预测模型进行错误分析

通过研究探讨了自然语言处理中层次结构篇章分析在修辞结构理论框架中的困难，并建立了与之相关的因素模型，其中隐含的篇章关系、识别远程关系的挑战、词汇外的项目等是现有工作中的解析难点。通过发布两个带有明确正确和干扰篇章标记的英文测试集，以评估这些变量的相对重要性。研究结果表明，如同浅层篇章分析，明示 / 隐含区别起到了一定作用，但远程依赖是主要挑战，而词汇重叠的缺乏则并非问题，至少对于领域内解析而言。最终的模型能够 76.3% 的准确率预测底向上解析器的错误和 76.6% 的准确率预测顶向下解析器的错误。

Sep, 2023

发掘神经言语解析器的能力 —— 使用大规模预训练的上下文和结构感知方法

这篇论文提出了一个简单但高精度的 RST 语篇分析器，采用最近的上下文语言模型，表现出两个重要数据集，RST-DT 和 Instr-DT 的最新技术性能。研究人员还表明，在最近可用的大规模 “银标准” 话语树库 MEGA-DT 上预训练我们的分析器可以提供更大的性能改进，这为话语分析领域提供了一种新的有前途的研究方向。

Nov, 2020