自监督句子压缩在会议摘要中的应用
我们提出了一种新颖的基于图形的框架,用于摘要会议演讲,完全不需要监督和任何注释。我们的工作结合了多种最近的方法的优点,同时解决了它们的弱点。此外,我们利用最近在 NLP 中应用的字嵌入和图形退化的进展,考虑外部语义知识,并设计了自定义的多样性和信息量度量。在 AMI 和 ICSI 语料库上的实验表明,我们的系统改进了现有技术水平。代码和数据可公开获取,我们的系统可以交互式测试。
May, 2018
本研究发现会议摘要的句子与会议议程有关,基于此提出了一种动态滑动窗口策略来解决长会议记录的自动文本摘要问题。实验结果表明,相较于传统模型,该方法获得了更高的文本一致性。
Aug, 2021
本文介绍了一种基于深度神经网络的视频摘要方法,该方法使用了多模态自监督学习框架,该框架可以在不需要大规模标注数据的情况下,通过视频与文本之间的语义一致性来获取视频的语义表示,并提出了一种渐进式摘要方法。实验表明,该方法的排名相关系数和 F 分数均优于现有视频摘要方法。
Jan, 2022
通过使用大型语言模型作为引导,本文提出了一种新颖的自监督视频摘要框架,通过生成视频帧的字幕,并将其合成为文本摘要,衡量帧字幕和文本摘要之间的语义距离,最终选择与文本摘要相似的帧来生成摘要视频。该方法在视频摘要任务中取得了有竞争力的结果,并为视频摘要领域开辟了新的道路。
May, 2024
文本摘要是自然语言处理领域的一个著名应用,可以自动根据给定的上下文生成带有重要信息的摘要,特别适用于会议总结等多主题、多人参与的长篇文档。我们提出了 Locater 模型用于提取有关片段,然后通过 Summarizer 模型进行总结,并应用不同的词嵌入技术进行了比较研究以提高摘要的一致性。
Feb, 2024
本文提出了一种新颖的直接抽取式语音摘要架构 ESSumm,它是一种基于深度学习的无线束模型,可以直接从语音中生成摘要,极大地提高了从未转录的数据的摘要质量。
Sep, 2022
提出了一个将会议记录按照方面进行总结的双阶段方法,它首先通过模拟标注的方式在 AMI 语料库上训练了一个句子分类器来选择特定方面的相关内容,然后将选定的句子合并作为输入,使用总结器生成基于方面的总结,实验结果表明该方法在 AMI 语料库上优于多个强基线模型,从而证明了我们提出方法的有效性。
Nov, 2023
本文提出了一种新颖的无监督句子摘要方法,将信息瓶颈原理映射到条件语言建模目标上,并使用迭代算法逐渐搜索给定句子的较短子序列,同时最大化下一个句子在摘要条件下的概率,从而实现对大语料库的抽取式句子摘要,并基于此方法,提出了一种自我监督的抽象式摘要方法,该方法经人工评估表明,优于无监督基线模型。
Sep, 2019
本文提出了一个基于句子压缩技术的任务框架,通过基于解析树的一系列学习模型,设计一种创新的 Beam Search 解码器来高效地找到高概率压缩结果,将语言学动机和查询相关性融入压缩过程中,并在多项指标上显著优于最先进的系统,包括在 DUC 2006 和 2007 摘要任务中分别获得 ROUGE-2 指标上 8.0% 和 5.4% 的改进。
Jun, 2016
本文提出了一种新颖的抽象会议摘要网络,采用分层结构和角色向量来处理会议记录,并在大规模新闻摘要数据上预训练模型,实现了在 ICSI 数据集上自动指标和人工评价方面的表现优于之前的方法。
Apr, 2020