基于不同修辞结构的端到端论证挖掘
基于修辞结构理论的话语解析(RST-DP)探索了子句、句子和大文本跨度如何组成整个话语,并将修辞结构呈现为一个分层树。现有的 RST 解析流水线在构建修辞结构时缺乏对文档级内容结构的了解,导致在预测大文本跨度的话语关系时性能相对较低。为了识别高级内容相关信息在促进话语关系识别方面的价值,我们提出了一种新颖的 RST-DP 流水线,该流水线结合了从新闻话语建模任务中得出的具有结构意识的新闻内容句子表示。通过仅添加了少量的附加层,这个增强的流水线在各种 RST 解析指标上表现出了很有前景的性能。
Sep, 2023
研究了通过利用多语言向量表示和采用源内容的分段级别翻译建立神经交叉语言篇章分析器的两种方法,并表明这两种方法即使在有限的训练数据下也有效,并且在所有子任务上实现了跨语言、文档级的篇章分析性能。
Dec, 2020
通过分析语篇结构中的修辞元素,文献使用的修辞结构理论 (RST) 解析器可以提高情感分析的准确性;该文献使用基于依存关系的位置调整方法和基于 RST 结构的递归神经网络模型分别取得了显著的效果提升。
Sep, 2015
本文提出了一种基于分裂决策的顶级自上而下的端到端文档级修辞结构理论(RST)框架下的论述解析方式,并采用 seq2seq 网络建模分离决策,无需依赖分段,融合高分树搜索算法得到最佳树结构,实验结果表明该解析器在端对端解析和使用黄金分段分析方面表现出色,且无需使用手工特征,速度更快,易于适应新的语言和领域。
May, 2021
本文提出了一个新型的文本摘要模型,RSTformer,综合考虑了修辞关系的类型和不确定性,采用基于文档级修辞结构的 RST-attention 机制,取得了显著的性能优势。
May, 2023
本文描述了一种 RST 分割和解析系统,该系统可以快速、稳健地处理新闻文章或文章等短文档,并将各种先前工作的模型和特征集进行了适应,其准确性接近于最先进的水平。
May, 2015
本文提出一种基于自上而下的神经网络结构,将话语的分层结构解析为分裂点排序任务,并在英文 RST-DT 语料库和中文 CDTB 语料库上进行实验,证明了该方法在文本级语篇分析中的高效性。
May, 2020
本文针对英语 RST 话语树库,提出了跨语言话语分析方法,并在西班牙语、德语、巴斯克语、荷兰语和巴西葡萄牙语中实验。该方法简单易行且有效,可以帮助更好地理解文件中的信息流和论证结构。
Jan, 2017
利用 Rhetorical Structure Theory (RST) 树和关系对话语连贯性进行评估,表明在分类连贯性方面增加银标准 RST 特征可以提高准确性,我们开发了一个 tree-recursive neural model,即 RST-Recursive,利用了由最先进的 RST 解析器产生的文本 RST 特征。在 Grammarly Corpus for Discourse Coherence (GCDC) 上评估我们的方法,并展示了当与现有先进技术结合使用时,我们可以在此基准测试中实现新的技术水平的准确性。此外,单独部署时,RST-Recursive 具有竞争性的准确性,同时参数减少了 62%。
Sep, 2020
通过研究探讨了自然语言处理中层次结构篇章分析在修辞结构理论框架中的困难,并建立了与之相关的因素模型,其中隐含的篇章关系、识别远程关系的挑战、词汇外的项目等是现有工作中的解析难点。通过发布两个带有明确正确和干扰篇章标记的英文测试集,以评估这些变量的相对重要性。研究结果表明,如同浅层篇章分析,明示 / 隐含区别起到了一定作用,但远程依赖是主要挑战,而词汇重叠的缺乏则并非问题,至少对于领域内解析而言。最终的模型能够 76.3% 的准确率预测底向上解析器的错误和 76.6% 的准确率预测顶向下解析器的错误。
Sep, 2023