ALTER: 自然语言生成辅助文本重写工具
本文提出了一种统一的自然语言生成(NLG)任务评估度量方法,基于信息对齐的概念,通过设计可解释的度量标准并使用自监督模型实现了度量方法的操作化,结果表明所提出的统一设计度量方法在各种 NLG 实验中具有比现有度量方法更强的相关性。
Sep, 2021
提出了GRS方法:一种结合文本生成和文本修订的无监督句子简化方法,包括显式编辑操作和释义作为新的编辑操作,相比现有方法在Newsela和ASSET数据集上展示了控制性和可解释性的优势。
Mar, 2022
本文介绍了一种人机交互的迭代文本修订系统(R3),该系统可提供高质量的文本修改建议,通过人机交互实现文档的迭代修订,从而使大语言模型在文本修订任务中发挥更大作用。
Apr, 2022
本文提出了一种基于Transformer、掩蔽语言模拟和属性分类的迭代就地文本修订方法,可以实现无需平行数据的文本修订,并在两个典型的文本修订任务上实现了竞争性和甚至更好的性能。
Apr, 2022
本文介绍了一个基于 TETRA 语料库的文档级修订助手。我们探索了无需参考评估和可解释的方法来评估文档修订的质量。实验结果表明,即使修订的差异微小,经过微调的预训练语言模型也能够区分文档修订后的质量,这为未来探索自动文档修订模型和评估指标奠定了基础。
May, 2022
本文提出EditEval:一种以指令为基础的评测套件,利用高质量的现有和新数据集自动评估编辑能力,证明了InstructGPT和PEER的表现最佳,而大多数基线都低于监督学习SOTA,本文通过这个基准的发布和公开可用的排行榜挑战,希望能够解锁未来发展能够进行迭代和更可控编辑的模型的研究。
Sep, 2022
本文介绍了将简洁性修改作为自然语言处理任务的算法,提出了一个用于刻画简洁写作的样本数据集,并介绍和评估了解决这个问题的方法,以便帮助研究者在这方面做出贡献。
Oct, 2022
本文提出了 SimpleStyle 方法,它包含了受控去噪和输出过滤两个简单部分,从而有效地实现了文本风格转换,并通过实验验证了其有效性。同时,作者还引入了一种名为“soft noising”的新技术来进一步改进系统性能,并将其应用于社交网络中真实文本数据的风格转换。作者建议 SimpleStyle 方法可作为属性控制文本重写领域的基准方法。
Dec, 2022
本文介绍了一种新的评估基准OpenRewriteEval和一个基于指令调整的大型语言模型RewriteLM,重点是长篇文本重写,展示了该模型在保留源文本的核心内容和意义,减少幻觉生成的内容,并展示了生成具有多种措辞和结构的改写的能力。
May, 2023