- 使用 Oracle Expectation 进行文本摘要
本文提出了一种用于文本摘要的新的标注算法,该算法使用基于期望的软标签,可以比常规的基于贪心算法的标注算法更加优秀地完成数据集的生成,同时在有监督和零样本学习中也取得了良好的性能表现。
- 探索日本最大的多机构健康记录档案中无结构健康记录的最佳粒度提取摘要
该论文旨在探讨医学专业自动文本摘要中的不同单位粒度,病历中的概念应该是如何被提取和组合的,研究发现将医学病历划分为更小的单位可以获得更高的文本摘要的准确性。
- 提取式总结不忠实:提取式总结中广泛的不忠实问题调查
本论文通过定义五个宽泛的不忠实问题类型(包括和超越非蕴涵)以及其他误导信息,论证了导致摘要不忠实的核心问题主要出现在 extractive summarization 中的指代和话语上,提出了新的检测误差的方法 ExtEval,并指出现存的 - 自动摘要中冗余与局部连贯性之间的权衡
使用心理语言学理论,我们在提取式摘要中实现了对不重复且连贯的元素进行排名。这个系统可以控制信息检索量的预算,并通过实验证明在处理冗余文档时提供了更少冗余的摘要。
- ACL优先阅读热门新闻:一种用于多文档新闻摘要的文档重排方法
一种简单的重新排序文档的方法,来提高多文档摘要的性能,从而更好地学习摘要模型。
- ACLHiStruct+: 基于层次结构信息的提取式文本摘要优化
通过提出的 HiStruct+ 模型,将 Transformer-based language models 中的层级结构信息显式注入到提取式文摘模型中,提高了 PubMed 和 arXiv 数据集中提取式文摘的 ROUGEs 指标,实验发 - 可微分多智能体演员 - 评论家算法在多步放射学报告摘要中的应用
本研究提出一种新的基于层级结构的放射学报告摘要方法,将提取性摘要分解为关键句和关键词的提取任务,并采用两步法的方式进行生成,实验结果显示此方法与传统单一或双一的实验方法相比,能够更准确地生成摘要,总体 F1 得分提高了 3-4%。
- ACL基于稀疏编码的无监督抽取式观点摘要
该研究提出了一种基于语义自动编码器(SemAE)的无监督抽取式网络评论摘要算法,并且能够进行具有可控性的方面特定性的摘要,实验结果表明该算法在 SPACE 和亚马逊数据集上表现强劲
- EMNLP人类引导下解释性注意力模式在摘要和主题分割中的应用
该论文介绍了一种结合人机交互的流程来发现重要的任务特定的注意力模式,然后注入到原始模型和较小的模型来提高模型的准确性与效率,取得了在提取式摘要和主题分割方面显著提高的结果。
- EMNLP低资源抽象摘要的多任务学习探究
研究了在小规模训练语料的情况下,使用多任务学习进行抽象摘要的效果。通过将四项不同任务(抽取式摘要、语言建模、概念检测和释义检测)单独和结合使用,得出训练多任务模型比训练仅用于抽象摘要的模型效果更好的结论。在全面搜索中,发现某些任务(如释义检 - AAAIUniMS: 面向多模态摘要的统一框架与知识蒸馏
提出了一种基于 BART 和 UniMS 的统一多模式摘要框架,该框架集成了抽取和生成目标,以及图像选择,通过视觉语言预训练模型进行知识蒸馏来改进图像选择,并引入视觉引导解码器来更好地整合文本和视觉模态,证明了提出的方法明显改善了多模态摘要 - ACL利用点互信息的非监督式抽取式摘要
通过使用点间互信息(PMI)计算相关性和冗余度量来提高提取性摘要,同时开展贪婪句子选择算法以最大化提取的句子的相关性和最小化冗余度。
- 文本摘要的上下文重写
本文探讨了在提取式摘要中基于全文进行 contextualized rewriting,将其形式化为 seq2seq 问题,引入 group tag 作为解决方案来建立关联,通过基于内容的寻址方法识别提取式摘要,结果表明我们的方法明显优于非 - EMNLPTransformer 的抽取式摘要真的需要那么多参数吗?语篇可以提供帮助!
该研究提出了一种基于文档级语篇信息的参数轻量级自我关注机制,相比原始转换器模型在参数数量上实现了显著减少,并在提取性摘要任务上实现了有竞争力的 ROUGE 分数。
- COLING基于 BERT 的分层图掩蔽的事实级提取式摘要
通过提取基于事实的语义单元,并将多级粒度的文本信息结合到模型中,并使用层次图表结合 BERT 模型,我们在 CNN/DailyMail 数据集上获得了最好的结果。
- 对抗语义碰撞
本论文研究语义碰撞,即在语义上不相关但被 NLP 模型认为相似的文本。我们开发了基于梯度的方法用于生成语义碰撞,并证明了许多任务的最新模型,这些任务依赖于分析文本的含义和相似性,包括释义识别、文档检索、响应建议和提取式摘要等方面的模型都容易 - ICML科技论文评论的自动生成
本文介绍了一种方法,可以根据用户定义的查询自动生成一篇综述论文。该方法包括两个主要部分,第一部分通过诸如同袍引用的图表等文献计量参数来识别领域中的关键论文。第二阶段使用 BERT 架构,我们在现有的综述论文中对这些关键论文进行抽取式摘要。我 - ACL利用潜在叙事结构进行剧本概述
本研究针对长篇叙述性文章提出了一种基于叙述结构的提取式摘要模型。通过将叙述结构转化为关键节点,导入非监督和监督提取式摘要模型,实验结果表明,潜在节点与 CSI 剧集的重要方面相关,并通过提高提取式算法的完整性和多样性改善了摘要性能。
- AAAI自动话语生成
本文提出了一种使用提取式摘要、多种换句技术和新颖的候选句子选择算法生成相关对话语句的系统来解决对话代理机器人中问答环节重要性的问题。
- ACL基于贝叶斯优化的交互式文本排名:以社区问答和摘要为例的案例研究
本研究提出了一种交互式文本排序方法,使用贝叶斯优化来聚焦在高质量的候选项上,以更好地适应于小数据场景,应用于社区问答和提取式摘要中,较之现有交互式方法具有明显优势,同时发现所学习的排序函数可以作为强化学习中有效的奖励函数。