简洁：一个被忽视的语言任务

EMNLPNov, 2022

Conciseness: An Overlooked Language Task

Felix Stahlberg, Aashish Kumar, Chris Alberti, Shankar Kumar

TL;DR本研究报道了一项新颖的训练模型，以让句子更加简洁。我们定义了这项任务，并展示它与其他相关任务（如摘要和简化）不同。通过发布两个由两个和五个人类注释者注释的测试集来进行评估。我们证明简洁性是一项难以完成的任务，而这项任务经常无法使用零 - shot 设置和大型神经语言模型。鉴于这些方法的局限性，我们提出了一种基于来回翻译的合成数据生成方法。使用这些数据，从头开始训练 Transformers 或对 T5 模型进行微调，可以得到我们最强的基线，可以通过在从多注释机器翻译测试集派生的人工简洁数据集上进行微调来进一步改进。

Abstract

We report on novel investigations into training models that make sentences concise. We define the task and show that it is different from related tasks such as summarization and simplification. For evaluation, we release two test sets, consisting of 2000 sentences each, that were annot

conciseness training models natural language processing synthetic data generation transformers

发现论文，激发创造

简洁性修订：一项受限的释义生成任务

本文介绍了将简洁性修改作为自然语言处理任务的算法，提出了一个用于刻画简洁写作的样本数据集，并介绍和评估了解决这个问题的方法，以便帮助研究者在这方面做出贡献。

Oct, 2022

学习将句子改写为不同复杂程度

本论文研究句子简化，提出了两个新的无监督数据集用于训练模型，并通过多任务和提示策略在大语言模型下进行实验，取得了最新的性能成果。

Aug, 2023

重新思考以句子并列为测试基础的文本整合

本文提出将句子联合生成任务作为一种有效的明确定义的测试基准，以评估文本合并能力，消除了主观内容选择的影响。针对该任务，我们提出了一套细化的注释方法和众包工具，创建了迄今最大的联合数据集，并提供了多种合并方面的丰富分析。最后，我们对最先进的语言模型进行了基线评估，并对它们解决多文本合并挑战的能力及其局限性进行了详细分析。

May, 2023

长指令摘要：化繁为简的程序综合

通过使用汇总版本来去除大型预训练语言模型中的无关信息，构建元数据集并测试在编程问题上的性能，从而提高了在各种编程问题中的性能表现。

Mar, 2022

总结（几乎）已死

大型语言模型在总结任务中表现出令人满意的性能，超过了参考摘要的基准，人类评估者明显偏好大型语言模型生成的摘要而不是人工撰写的摘要和经过微调的模型生成的摘要，因为大型语言模型生成的摘要具有更好的事实连贯性和更少的外在幻觉实例。

Sep, 2023

基于大型语言模型的句子简化

本文使用零 / 少量数据训练的大型语言模型在众多基准测试集上进行了实验分析，结果表明 LLMs 优于最先进的句子简化方法，并被评为与人类标注者一致。

Feb, 2023

观点摘要的小样本学习

本文介绍了一种学习无监督条款，在生成模型中引入少量样本来捕获其必要属性的方法，用于生成商品评论等主观性文本的摘要，该方法比以往的提取和抽象方法更有效。

Apr, 2020

新闻摘要的大型语言模型基准测试

通过对十种不同的预训练方法、提示和模型规模的大型语言模型进行人类评估，我们发现指导调整而不是模型规模是 LLM 的零样本摘要能力的关键，并通过从自由职业作家收集的高质量摘要进行人类评估，得出 LLM 摘要被认为与人类撰写的摘要相媲美的结论。

Jan, 2023

教小型语言模型如何推广到未见过的组合问题

我们在本文中提出了一种通过多任务监督预训练和密集检索系统的组合来实现对具有挑战性的复合问题的泛化的方法，并且展示了通过添加用于训练的检索增强数据集可以显著提高模型的性能。

Aug, 2023

USB：跨任务和领域的统一摘要基准

本研究提出一个多维理解摘要的基准测试，并在其上比较了多种模型的性能，发现中等规模的微调模型在多个任务上始终优于更大的几次提示语言模型。同时发现，对于某些任务，训练数据的数量比其来源领域更重要，而对于其他任务，尽管数据量有限，但特定领域的数据更为有益。

May, 2023