跨语言 RST 篇章分析
研究了通过利用多语言向量表示和采用源内容的分段级别翻译建立神经交叉语言篇章分析器的两种方法,并表明这两种方法即使在有限的训练数据下也有效,并且在所有子任务上实现了跨语言、文档级的篇章分析性能。
Dec, 2020
本文提出一个基于文档级别的多语言 RST 话语分析框架,该框架将 EDU 分割和话语树解析结合在一起,并且引入了跨语言翻译增强策略,以支持多语言解析并改善其领域通用性,实验结果表明,该模型在所有子任务中实现了文档级别多语言 RST 解析的最新性能。
Oct, 2021
本文提出了一种基于分裂决策的顶级自上而下的端到端文档级修辞结构理论(RST)框架下的论述解析方式,并采用 seq2seq 网络建模分离决策,无需依赖分段,融合高分树搜索算法得到最佳树结构,实验结果表明该解析器在端对端解析和使用黄金分段分析方面表现出色,且无需使用手工特征,速度更快,易于适应新的语言和领域。
May, 2021
基于修辞结构理论的话语解析(RST-DP)探索了子句、句子和大文本跨度如何组成整个话语,并将修辞结构呈现为一个分层树。现有的 RST 解析流水线在构建修辞结构时缺乏对文档级内容结构的了解,导致在预测大文本跨度的话语关系时性能相对较低。为了识别高级内容相关信息在促进话语关系识别方面的价值,我们提出了一种新颖的 RST-DP 流水线,该流水线结合了从新闻话语建模任务中得出的具有结构意识的新闻内容句子表示。通过仅添加了少量的附加层,这个增强的流水线在各种 RST 解析指标上表现出了很有前景的性能。
Sep, 2023
本文提出了第一个 在句法和语篇层面上共同解析 的端到端语篇解析器,并通过将宾州树库与 RST 树库集成来提供第一个语法树处理工具。该工具构建在最新的基于区间的组成解析器上,不需要任何预处理,并实现最先进的端到端语篇解析精度。
Aug, 2017
这篇论文提出了一个简单但高精度的 RST 语篇分析器,采用最近的上下文语言模型,表现出两个重要数据集,RST-DT 和 Instr-DT 的最新技术性能。研究人员还表明,在最近可用的大规模 “银标准” 话语树库 MEGA-DT 上预训练我们的分析器可以提供更大的性能改进,这为话语分析领域提供了一种新的有前途的研究方向。
Nov, 2020
本篇论文探讨了一种强有力的基准线,通过将现有的简单解析策略(自上而下和自下而上)与各种基于 Transformer 的预先训练的语言模型进行集成,实现了 RST 风格的话语解析模型的推广和进一步发展。实验结果表明,解析性能强烈依赖预先训练的语言模型,尤其是 DeBERTa 对自下而上解析器表现的大幅提升。此外,我们还发现具有跨度屏蔽方案的语言模型特别能提高解析性能。
Oct, 2022
通过引入跨语言训练策略,深入分析和改进基于 Discourse Representation Structure(DRS)的语义表示分析模型,在英语、德语、意大利语和荷兰语的标准基准测试中取得了最先进的结果,并为未来的 DRS 分析研究提供了深入的见解。
Jun, 2024
本文描述了一种 RST 分割和解析系统,该系统可以快速、稳健地处理新闻文章或文章等短文档,并将各种先前工作的模型和特征集进行了适应,其准确性接近于最先进的水平。
May, 2015
使用神经框架和指针网络,基于 Rhetorical Structure Theory (RST) 的句子级别的语篇分析提出了一种高效的分析方法。基于分段器和分析器的性能表现显示出此方法具有优势且逼近人类认知水平。
May, 2019