- LLaMIPa: 增量对话解析器
该研究提出了首个使用在 SDRT 风格标注的语料库上进行微调的大型语言模型(LLM)进行话语解析实验。结果是一个名为 LLaMIPa(LLaMA 增量解析器)的话语解析器,能够更充分地利用话语背景,相较于只使用编码器模型提供局部、上下文敏感 - 对话篇章解析和主题分割的无监督共学习
通过主题分割和话语解析,我们提出了一种无监督的两种结构的互学习框架,以实现对话系统的全局目标和话语策略的一致性。实验结果表明,我们的方法在两个对话话语数据集(STAC 和 Molweni)以及对话主题数据集(Doc2Dial 和 TIAGE - ACL通过使用大型语言模型,在 RST 篇章分析中能否取得显著成功?
本文研究了具有数十亿参数的解码器预训练大型语言模型(LLMs)对修辞结构理论(RST)的语篇分析的影响,并且在基于自上而下和自下而上策略的语篇解析过程中,将此解析过程转化为 LLMs 可以处理的提示,并通过 Llama 2 进行了微调。实验 - EMNLP基于提示的逻辑语义增强的隐含篇章关系识别
通过 Prompt-based 连接词预测将与话语关系相关的知识无缝地注入到预训练语言模型中,提出了 Prompt-based Logical Semantics Enhancement(PLSE)方法,使其能够轻松获取逻辑语义的丰富特征, - 以文档级内容结构为导向的 RST 风格的篇章解析
基于修辞结构理论的话语解析(RST-DP)探索了子句、句子和大文本跨度如何组成整个话语,并将修辞结构呈现为一个分层树。现有的 RST 解析流水线在构建修辞结构时缺乏对文档级内容结构的了解,导致在预测大文本跨度的话语关系时性能相对较低。为了识 - ACL英语隐含语篇关系分类的 Transformer 之间的并排比较
基于 PDTB-3 数据集,通过对七个预训练语言模型的直接性能比较,我们的模型搜索将 SOTA 提高到了 0.671 的准确率,同时得到了一些新的观察结果,其中包括相对于之前的报道(Shi 和 Demberg, 2019b),句子级预训练目 - 基于主题驱动的远程监督框架用于宏观层面的话语解析
通过使用主题结构和教师 - 学生模型的标签转换和 Oracle 注释,我们提出了一种远程监督的框架,用于解决在领域内和领域外任务之间间隔较大的问题。在 MCDTB 和 RST-DT 数据集上,我们的方法都表现出了最佳的性能。
- 聊天 GPT 在对话中的话语分析潜力:实证研究
本研究探讨了 ChatGPT 在话语语篇分析中的能力,特别是话题分割、话语关系识别和话语分析三个任务的能力。结合创新的思维链(COT)方法,发现 ChatGPT 对于话题分割有较好的表现,但在话语关系识别和话语分析等较难的任务中有待提高。
- ACL为什么话语分析无法概括?关于数据多样性影响的彻底调查
在研究中,我们证明了高资源语言(如英语)在 RST 解析方面的性能并没有变得可靠,而我们使用两个最大的英语 RST 语料库在新闻领域中研究了数据多样性对解析稳定性的影响,结果表明异构训练是获得稳定且可推广模型的关键。同时,我们还提供了模型输 - 可扩展远程监督的大型话语树库
本研究提出了一种使用情感分析辅助任务的 “银标准” 话语树框架,从而允许更大、更多样化和独立于领域的数据集训练话语解析器,以实现自然语言处理的上游任务,并在许多实际应用中具有强大的影响力。
- 通过梯度提升实现领域无关的监督式话语解析
本文提出了一种新的有监督范式,用于解决语篇分析中域依赖的问题,通过梯度提升框架引入弱分类器级联模型,设计了第一个完全有监督的语篇分析器。
- 使用树自动编码器无监督推断基于数据驱动的话语结构
为解决语篇树结构数据不足的问题,本文提出了一种基于无监督学习和隐式树归纳框架扩展的自动编码目标策略,可应用于生成语法分析、语篇分析等任何树状结构目标。
- 简化特征提取器可避免神经语篇分析模型的过拟合
利用自我注意机制和预训练神经语言模型来简化特征提取器,缓解过拟合问题,并在三种常见的语篇分析任务上进行实验,得出了更好的泛化性和相当甚至更好的系统性能的结论。
- ACL使用话语解析的多任务对话理解
提出了一个用于多方对话机器阅读理解 (MRC) 的多任务模型,结合问答 (QA) 和话语解析 (DP) 任务,在 Molweni 基准测试中证明了多任务训练不仅受益于 QA 任务,也有助于 DP 任务,当处理更长的对话时,联合模型表现得更强 - ACL一种条件分割框架用于高效的成分句法分析
该研究介绍了一种通用的 seq2seq 分析框架,将组成分析问题(语法和话语分析)转化为一系列条件分裂决策。我们的方法支持高效的自上而下解码,可以实现结构一致性且不需要昂贵的结构化推理。实验结果表明,在语法分析任务和话语分析任务中,我们的方 - ACL中文会话语音中代词缺失恢复和对话语篇分析的联合模型
本文提出了 DiscProReco,一种神经模型,用于联合恢复 DPR 和对话语篇分析 CDP,并进一步证明 DPR 和 CDP 之间的相关性。DiscProReco 利用有向图卷积网络来编码对话中的 utterance,使用 biaffi - ACL基于序列标注的自顶向下篇章分析
本研究介绍了一种自上而下的话语分析方法,该方法的目标是将文档迭代地分段成个体话语单元,这种方法不仅消除了解码器,而且减少了划分点的搜索空间,同时使用了 LSTM 模型,在全指标下达到了最新的 RST 分析结果。
- EMNLP可扩展遥感情感监督数据生成的具有结构和核心性的 MEGA RST 话语树库
本研究提出了一种新的可扩展的方法用于自动生成论述树库,同时发布了一个新的大规模的语料库 MEGA-DT,通过多个数据集的实验表明,在 MEGA-DT 树库训练出的论述解析器相对于训练在人工注释语料库上的解析器表现得到了显著提升。
- EMNLP利用来自情感的远程监督来预测话语结构
本研究提出了一种新方法,使用情感分类的远程监督来生成丰富数据进行 RST 风格讨论结构预测,该方法结合了一种基于神经网络的多实例学习和一种 CKY-style 树生成算法,结果表明该解析器在跨领域讨论结构预测方面表现出色。
- EMNLP层次化指针网络解析
本论文提出了一种基于层次指针网络的转移式解析方法,该方法在依赖和语篇关系解析方面具有优异的表现,超过现有方法并创造了新的最高水平。