- 利用话语结构创建会议摘要
基于 GNN 的节点分类模型,利用话语结构从复杂的多方讨论中筛选出最重要的话语,并生成提取式摘要,实验证明该方法超过现有的基于文本和图的提取式摘要系统。
- ACLRST-LoRA: 面向长文档抽象摘要的语篇感知低秩适应
本文引入 RST-LoRA,提出了四种 RST 感知的变体,明确将 RST 融入 LoRA 模型,评估结果表明,引入修辞关系的类型和不确定性可以有效增强 LoRA 在摘要任务中的性能,最佳性能的变体优于普通的 LoRA 和全参数微调模型,并 - Instruct-SCTG:通过指导实现序列控制文本生成
本文介绍了 Instruct-SCTG 框架,利用调谐指令的语言模型在精细调整和零 - shot 设置中生成结构连贯的文章,通过自然语言指令对生成的文本进行段落层次的控制,并引入了一种模糊度量衡来衡量篇章发散程度。实验结果验证了该框架在新闻 - EMNLP利用 LLMs 深入挖掘长文档问答中的话语结构
通过利用文档中普遍存在的话语结构,我们提出了一套技术方法,创造出文档的简洁表示形式,从而更全面地理解和分析不同部分之间的关系。我们保留了最佳零射击方法性能的 99.6%,同时仅处理了最佳方法在信息查询证据检索设置中使用的总令牌数量的 26% - ACL利用话语结构分布进行长文本抽象摘要
本文提出了一个新型的文本摘要模型,RSTformer,综合考虑了修辞关系的类型和不确定性,采用基于文档级修辞结构的 RST-attention 机制,取得了显著的性能优势。
- ACL利用潜在话语推断预训练多方对话模型
通过无监督潜在变量推理方法联合推断对话结构并预训练多方对话感知模型,实现了优于基线的最新技术结果。
- ACL多模多方对话中的讽刺解释
本文提出了一项新的任务 —— 对话中的讽刺解释,并针对多模态和混合编码的情境,提出了一种多模态上下文感知的关注和全局信息融合模块 MAF 来捕捉多模态,并使用其来支持我们的任务。
- EMNLP探索论点结构在网络辩论说服中的作用
本文提出了使用因子图模型来获取在线辩论平台上的论点结构特征,并将这些特征结合到基于 LSTM 的模型中,以预测哪位辩手的论点最有说服力。研究发现,在评估在线辩论中的论点说服力时,结合论点结构特征可以发挥重要作用。
- COLINGMolweni:挑战多方对话基础机器阅读理解数据集带有话语结构
本文介绍了 Molweni 数据集,这是一个具有复杂话语结构的机器阅读理解数据集,其中包含来自 Ubuntu Chat 语料库的 10,000 个多方对话,我们对该数据集进行了超过 30,000 个问题的注释,并为所有多方对话贡献了大规模( - 使用语篇结构进行机器翻译评价的 DiscoTK
本文提出了新颖的自动度量标准,使用议论结构和卷积核比较自动翻译的议论树和人类参考的议论树,并通过五种转换技术和增强基于修辞结构理论的基础议论树表示的方法,并将其得分结合成一个综合评分。最后,从 ASIYA MT 评估工具包中添加其他指标,并 - ACL结构化文本表示中的话语评估
通过结构化的注意力机制来获得文本的 RST 语篇树结构是一种学习蕴含语篇结构的潜在表示的有吸引力的替代方法。通过评估其他与语篇相关的任务和数据集后,我们发现这种方法并不能很好地捕捉文本的语篇结构,即使模型做了一些结构性的改进,也不能和基于现 - DeepTileBars:神经信息检索术语分布可视化
本篇研究提出了一种新型的神经信息检索模型 DeepTileBars,能够以子话题和更高层次处理查询到文档之间的匹配关系,其能够更好地捕捉文档的话语结构和匹配模式。实验结果显示,DeepTileBars 在 TREC 2010-2012 We - 信息检索的修辞关系
通过研究修辞关系在信息检索中的应用,本文提出了一种基于语言模型修辞关系的改进方法,实证评估结果显示,使用特定的修辞关系可以显著提高检索有效性。
- ACL文本分类的神经话语结构
本文研究利用 Rhetorical Structure Theory 和递归神经网络(使用新提出的 attention 机制)来加强文本分类的方法,实验结果表明其优势和劣势。
- 文档上下文语言模型
文本文件通常按多个层次结构化:单个单词由语法相关联,但更大的文本单元由话语结构相关联。本研究提出并实证评估了一组多级递归神经网络语言模型,称为文档上下文语言模型(DCLM),它们在句子内外都融入上下文信息。与基于单词级的递归神经网络语言模型 - EMNLP从 RST 论述分析提升文件级情感分析
通过分析语篇结构中的修辞元素,文献使用的修辞结构理论 (RST) 解析器可以提高情感分析的准确性;该文献使用基于依存关系的位置调整方法和基于 RST 结构的递归神经网络模型分别取得了显著的效果提升。
- 对话生成物体描述的学习内容选择规则
本文研究聊天机器人生成任务型对话中的对象描述内容选取这一子问题,使用基于不同模型的特征集进行机器学习并训练出选择对象描述内容的组件,其中包括递增模型、概念协定模型和意图影响模型。同时,本文还与简单的 recentity 模型进行了对比实验, - 一种用于文档压缩的噪声信道模型
我们提出了一种使用层级噪声信道模型的文档压缩系统,该系统可以自动获取输入文本的句法结构和总体话语结构,并使用统计模型生成连贯的、语法正确的文档摘要。我们的实验结果支持话语知识在文档摘要中发挥重要作用的观点。
- 代词化与语篇结构
通过研究表明,许多常见的副词短语一般被认为是表示话语结构内句法连接单元之间的话语关系,实际上是指代地为组成意义做出贡献,只是间接依赖于话语结构。这为组合语义提供了一个更简单的话语结构,并揭示了副词连词所传达的关系含义与话语结构相关的多种交互 - 使用分层凝聚聚类分割说明性文本
本文提出了一种基于分层凝聚聚类的说明性文本分段方法,该方法使用段落作为基本段落,通过它们之间的词汇相似度进行文本的分层话结构识别。该算法已经证明与现有的线性分割方法具有可比较的结果。