有限平行资源下的跨语言抽象摘要

ACLMay, 2021

有限平行资源下的跨语言抽象摘要

Cross-Lingual Abstractive Summarization with Limited Parallel Resources

Yu Bai, Yang Gao, Heyan Huang

TL;DR使用一种多任务框架和共享解码器的方法，跨语言摘要的跨语言资源匮乏问题得以解决，此方法名为 MCLAS。通过 MCLAS，实验表明其可以在有限的跨语言资源下，显著优于三种基准模型。

Abstract

Parallel cross-lingual summarization data is scarce, requiring models to better use the limited available cross-lingual resources. Existing methods to do so often adopt sequence-to-sequence networks with multi-task frameworks. Such approaches apply multiple decoders, each of which is u

cross-lingual summarization multi-task learning low-resource setting knowledge transfer alignment

发现论文，激发创造

跨语言摘要的混合语言预训练

使用混合语言预训练的交叉语言文摘模型，在没有任务特定组件的情况下利用单语数据提高语言建模的效果，实现了高效的跨语言文摘。在 Neural Cross-Lingual Summarization 数据集中，我们的模型在英汉和汉英模式下相比现有技术，分别实现了 2.82 和 1.15 ROUGE-1 分数的提升。

Oct, 2020

NCLS: 神经跨语言摘要

通过多任务学习、循环翻译等方法，构建神经网络模型用于实现跨语言文本摘要，实验结果证明该模型较传统模型有显著提升。

Aug, 2019

神经跨语言摘要变分分层模型

本文提出了基于条件变分自编码器的层次模型，用于将一个语言的文档转化为另一个语言的摘要，从而解决了直接进行交叉语言摘要的挑战，实验证明这种方法比现有的方法更为有效和优越。

Mar, 2022

使用压缩率统一跨语言摘要和机器翻译

通过提出 Cross-lingual Summarization with Compression rate (CSC) 的创新任务，并通过有效的数据增强方法来产生不同压缩率的文档摘要对，从而提高 Cross-Lingual Summarization 的性能。

Oct, 2021

跨语言抽象摘要的多任务学习

Transum 是一种多任务学习框架，可以将真实数据及伪造数据结合起来用于神经编码器 - 解码器的训练，达到在汉英和阿拉伯英文摘要、中英、阿拉伯英翻译任务中均获得最佳 ROUGE 分的效果，此外还对机器翻译任务有积极的影响。

Oct, 2020

ClueGraphSum: 让关键线索指导跨语言概括式摘要

该研究提出了一种线索引导的跨语言自动摘要方法来提高自动生成摘要的质量，并针对手写数据进行了实验评估，取得了较好的结果。

Mar, 2022

实现多语言和跨语言摘要统一化

本文提出了一种多对多摘要（M2MS）的通用框架，可以通过预培训的 Pisces 模型实现任何语言的文档摘要生成，特别在零样本学习中性能显著优于现有算法。

May, 2023

低资源抽象摘要的多任务学习探究

研究了在小规模训练语料的情况下，使用多任务学习进行抽象摘要的效果。通过将四项不同任务（抽取式摘要、语言建模、概念检测和释义检测）单独和结合使用，得出训练多任务模型比训练仅用于抽象摘要的模型效果更好的结论。在全面搜索中，发现某些任务（如释义检测）不仅可以与其他任务结合使用，而且可以使用不同的架构和训练语料，始终对抽象摘要有益。

Sep, 2021

大型语言模型的少样本学习跨语言摘要任务

跨语种摘要生成（XLS）旨在在与源语言文档不同的目标语言中生成摘要。我们研究了各种模型的少样本学习（few-shot learning）在 XLS 任务中的表现，并发现少样本学习显著提高了 LLMs 在低资源环境中的 XLS 性能，特别是 GPT-3.5 和 GPT-4。然而，开源模型 Mistral-7B-Instruct-v0.2 在有限的示例中有效适应 XLS 任务方面存在困难。我们的研究结果突出了少样本学习提高 XLS 性能的潜力，以及在设计专为该任务定制的 LLMs 架构和预训练目标方面需要进一步研究。我们提出了未来的研究方向，探索更有效的少样本学习策略，并调查 LLMs 在跨语种摘要生成中的迁移学习能力。

Jun, 2024

再探跨语言摘要：基于语料库的研究与改进注释的新基准

现有的跨语言摘要（CLS）工作往往通过直接翻译预注摘要来构建 CLS 语料库，可能会包含摘要和翻译过程中的错误。为了解决这个问题，我们提出了 ConvSumX，这是一个跨语言对话摘要基准，通过一个新的注释模式明确考虑源输入上下文。ConvSumX 包括两个子任务，涵盖了三个不同的语言方向。我们对 ConvSumX 和三个广泛使用的手动注释的 CLS 语料库进行了详尽的分析，实验证明 ConvSumX 更加忠实于输入文本。此外，基于相同的观点，我们提出了一个 2 步方法，该方法将对话和摘要作为输入以模拟人工注释过程。实验结果表明，2 步方法在 ConvSumX 上超过了强基线模型，并在自动和人工评估下显示出优势。分析表明，源输入文本和摘要对于建模跨语言摘要至关重要。

Jul, 2023