Par4Sim -- 文本简化的自适应改写技术

COLINGJun, 2018

Par4Sim -- 文本简化的自适应改写技术

Par4Sim -- Adaptive Paraphrasing for Text Simplification

Seid Muhie Yimam, Chris Biemann

TL;DR本研究开发了一个自适应学习系统用于文本简化，从使用数据中改进基于学习排序模型的性能，并通过实验结果表明，该系统在 NDCG@10 评估指标上的得分从 62.88％提高到 75.70％。这是首个使用使用数据对 NLP 组件进行自适应改进的研究。

Abstract

Learning from a real-world data stream and continuously updating the model without explicit supervision is a new challenge for nlp applications with machine learning components. In this work, we have developed an adaptive learning system for →

adaptive learning text simplification nlp learning-to-rank model usage data

发现论文，激发创造

展示 PAR4SEM - 一种具备自适应改写功能的语义写作辅助工具

本文介绍了基于自适应换言的语义写作辅助工具 Par4Sem，并通过将其应用于文本简化任务来评估其性能。

Aug, 2018

明确的复述控制文本简化

提出了一种新型的混合方法，它结合了基于语言学的分裂和删除规则以及神经语言转换模型来进行不同的简化操作，并通过引入新的数据增强方法来提高模型的语言转换能力。通过自动和手动评估，证明该模型在对比现有系统时，产生了更多的语言转换，并且可以控制所应用的每个简化操作的程度。

Oct, 2020

学习将句子改写为不同复杂程度

本论文研究句子简化，提出了两个新的无监督数据集用于训练模型，并通过多任务和提示策略在大语言模型下进行实验，取得了最新的性能成果。

Aug, 2023

句子简化的动态多层多任务学习

本文提出了一种基于序列到序列的句子简化模型，通过多任务学习及时改进其包含性和释义能力。文章还介绍了一种新的多层软共享方法，以及一种动态学习的多臂赌博机训练方法，实验结果表明我们的模型在语义相关任务上的表现优于竞争模型。

Jun, 2018

利用释义生成快速启动对话系统

该研究提出了一种基于改写生成的方法，可以减少创建新对话代理所需要的时间和成本，同时提高其性能，使其能够实际与真实用户进行交互。实验证明该方法提高了意图分类模型的泛化能力，有助于在组织范围内规模化部署这项技术。

Apr, 2022

通过生成改写句实现多语言词汇简化

基于预训练语言模型的词汇简化方法取得了显著进展，通过分析词语在其上下文环境中的替代词生成复杂词的潜在替代词。然而，这些方法需要针对不同语言进行单独的预训练模型，并且忽略了对句子意义的保留。本文提出了一种新颖的多语言词汇简化方法，通过生成释义来提供词语选择的多样性，同时保持句子的意义。我们将释义任务视为支持数百种语言的多语言神经机器翻译中的零 - shot 翻译任务。在释义建模的编码器中输入句子后，我们基于一种集中于复杂词的词汇变体的新颖解码策略生成替代词。实验结果表明，我们的方法在英语、西班牙语和葡萄牙语上明显优于基于 BERT 的方法和零 - shot GPT3 方法。

Jul, 2023

不是所有指标都有罪：利用 LLM 改进 NLG 评估的修辞转换技术

本文提出了 Para-Ref，一种通过利用大型语言模型进行重新创作来增强现有自然语言生成评估基准的新方法，并在机器翻译、文本摘要和图像标题等任务中的实验结果表明，该方法能够通过多个高质量的参考文本使人工评估结果与 16 种自动评估指标之间的相关度提高了 7.82%。

May, 2023

通过改写实现强大的口语理解

本论文提出了一种新颖的基于改写的 SLU 模型，结合 RNN 和序列到序列的神经网络提出了两个改写生成器，并证明了模型对罕见和复杂的改写话语具有鲁棒性。

Sep, 2018

整合 Transformer 模型与复述规则的句子简化

本研究提出了一种基于多层和多头注意力架构的新颖模型，并提出了两种集成 Simple PPDB 的创新方法，实现对句子的简化。该研究表明，集成 Simple PPDB 的模型在句子简化中的表现优于现有基准模型，并能够准确定位并选择更精确的简化规则。

Oct, 2018

一个词汇复杂度词典和神经可读性排名模型，用于词汇简化

本文利用基于人类判断的词汇复杂性词典和基于高斯的特征向量化层提出了一种新的神经可读性排名模型，用于衡量任何给定单词或短语的复杂性，并通过将该模型应用于 Paraphrase 数据库（PPDB）生成了超过 1000 万个简化的复述规则。实验证明，我们的模型在不同的词汇简化任务和评估数据集上表现优于现有的最佳系统。

Oct, 2018