基于词典引导的编辑网络的释义生成

Jun, 2018

基于词典引导的编辑网络的释义生成

Dictionary-Guided Editing Networks for Paraphrase Generation

Shaohan Huang, Yu Wu, Furu Wei, Ming Zhou

TL;DR本文提出了利用字典引导的编辑网络模型来生成同义句的方法，并在两个基准数据集上进行了实验，证明其比基线方法表现更好。

Abstract

An intuitive way for a human to write paraphrase sentences is to replace words or phrases in the original sentence with their corresponding synonyms and make necessary changes to ensure the new sentences are fluent and grammatically correct. We propose a novel approach to modeling the process with →

paraphrase generation dictionary-guided editing networks sequence-to-sequence framework ppdb benchmark datasets

发现论文，激发创造

通过自动爬取和对齐的句子对进行神经重述

本文介绍了一种基于语言约束的相似性搜索方法，用于自动产生大规模对齐语料库，以解决基于神经网络的释义生成面临的数据缺乏问题。该方法在意大利语的情况下进行评估，并使用基于指针的深度神经网络架构实验。

Feb, 2024

从释义数据库到组合释义模型再回到释义数据库

本文介绍了如何利用 Paraphrase Database 数据库中的短语对来构建参数化的释义模型，进而提高其覆盖范围和准确性，并介绍了两个人工标注的数据集以评估这些模型。使用我们的参数化释义模型，我们在标准单词和双字词相似度任务上实现了最佳结果，并在新的短语释义任务中击败了强大的基线模型。

Jun, 2015

预训练语言模型无监督的改写技术

本文研究了基于转移学习的无监督方法生成高质量的同义改写，其中采用了任务自适应、自监督学习和名为 Dynamic Blocking 的新型解码算法。该方法在问答数据集和 ParaNMT 数据集上均取得了最新的性能，并且在不同语言改写中具有良好的迁移性能。

Oct, 2020

一个用于释义生成的深度生成框架

本篇论文研究了一种使用深度生成模型（VAE）与序列到序列模型（LSTM）相结合的方法来自动生成给定句子的同义句，相对于现有方法具有更好的性能和简洁的模块化结构。

Sep, 2017

弱监督下的选择性学习用于释义生成

本文提出了利用元学习框架解决弱监督下的释义生成任务，并通过检索式的伪释义扩展获取大量弱标注平行句子，进而选择有价值的样本对预训练语言模型 BART 进行微调，从而生成高质量释义的方法，与目前的无监督学习方法相比具有显著的改进。

Sep, 2021

利用释义生成快速启动对话系统

该研究提出了一种基于改写生成的方法，可以减少创建新对话代理所需要的时间和成本，同时提高其性能，使其能够实际与真实用户进行交互。实验证明该方法提高了意图分类模型的泛化能力，有助于在组织范围内规模化部署这项技术。

Apr, 2022

学习改写以进行问答

利用释义学习问题表达的多样性来提高询问回答系统在 Freebase 和句子选择上的准确性。通过训练端到端来直接学习最有可能产生正确答案的语言表达，得到了有竞争力的结果。

Aug, 2017

在不使用已标注平行对的情况下生成句法控制的同义改写句

本文提出了一种基于编码器 - 解码器的模型，名为 Syntactically controlled Paraphrase Generator (SynPG)，它可以从未注释的文本集合中学习将一句话的语义和语法分离的能力，从而生成语法各异的释义，而无需使用大量注释的释义对。自动评价和人工评价的实验结果表明，该模型在语法控制方面的表现优于无监督基线，同时生成的释义的质量也具有竞争力。同时，经过充分的训练，该模型的性能与有监督模型相媲美，甚至更好，使其生成的语法受控释义可以用于数据增强，以提高 NLP 模型的健壮性。

Jan, 2021

句法控制释义网络生成对抗性样本

通过建议句法控制的转述网络，生成对抗样例，数据来自大规模的回译，尝试指定目标句法，通过人工和自动化评估表明此系统可以发现还原目标规范且性能不亚于现有对照组，增强了对语法变化的鲁棒性。

Apr, 2018

基于矢量量化提示学习的释义生成

通过利用预训练模型和实例相关提示，本文提出生成多样且高质量的复述词句的方法，使用向量量化的提示来控制预训练模型的生成。实验表明此方法在三个基准数据集上取得了最新的最佳结果，包括 Quora、Wikianswers 和 MSCOCO。一旦被接受，我们将公开所有代码。

Nov, 2023