分析鹦鹉学舌在释义生成数据集上的表现

EMNLPAug, 2019

分析鹦鹉学舌在释义生成数据集上的表现

Polly Want a Cracker: Analyzing Performance of Parroting on Paraphrase Generation Datasets

Hongren Mao, Hung-yi Lee

TL;DR本文分析了用于释义生成研究的常用数据集，发现当用标准度量进行评估时，简单地模仿输入句子超越了文献中的最先进模型，说明模型可能似乎熟练地生成释义，尽管对输入句子只进行了微不足道的更改，甚至完全没有更改。

Abstract

paraphrase generation is an interesting and challenging nlp task which has numerous practical applications. In this paper, we analyze datasets

paraphrase generation nlp datasets state-of-the-art models standard metrics

发现论文，激发创造

利用释义生成快速启动对话系统

该研究提出了一种基于改写生成的方法，可以减少创建新对话代理所需要的时间和成本，同时提高其性能，使其能够实际与真实用户进行交互。实验证明该方法提高了意图分类模型的泛化能力，有助于在组织范围内规模化部署这项技术。

Apr, 2022

通过自动爬取和对齐的句子对进行神经重述

本文介绍了一种基于语言约束的相似性搜索方法，用于自动产生大规模对齐语料库，以解决基于神经网络的释义生成面临的数据缺乏问题。该方法在意大利语的情况下进行评估，并使用基于指针的深度神经网络架构实验。

Feb, 2024

学习改写以进行问答

利用释义学习问题表达的多样性来提高询问回答系统在 Freebase 和句子选择上的准确性。通过训练端到端来直接学习最有可能产生正确答案的语言表达，得到了有竞争力的结果。

Aug, 2017

不改写，检测！用于语义解析的快速有效数据收集

本文针对自然语言和逻辑形式之间的映射、基于众包的数据收集方式存在的问题进行了深入分析，提出了一种结合模型和众包技术的数据收集方法，以减轻众包方法带来的偏差，实验结果表明，该方法对于自然语言和逻辑形式解析的准确度相对更高。

Aug, 2019

隐喻释义生成：用字面文本来训练隐喻语言模型

通过使用隐喻语言模型掩盖字面意思从而生成比喻性的解释，且该方法不仅关注动词，还包括名词和形容词。这种方法在元数据的分类中实现了比人工方法更高的水平。

Oct, 2022

一个用于释义生成的深度生成框架

本篇论文研究了一种使用深度生成模型（VAE）与序列到序列模型（LSTM）相结合的方法来自动生成给定句子的同义句，相对于现有方法具有更好的性能和简洁的模块化结构。

Sep, 2017

隐喻性解释生成

本文描述了隐喻释义生成的任务，并提出了两种不同的模型：词汇替换基线和一种新的序列 - 序列模型 “隐喻屏蔽”，它可以生成自由的隐喻释义。我们使用众包来评估我们的结果，并开发了自动度量衡来评估隐喻释义。我们发现，虽然词汇替换基线能够产生准确的释义，但它们往往缺乏隐喻，而我们的隐喻屏蔽模型在生成隐喻句子方面表现出色，同时在流利度和释义质量方面表现也很好。

Feb, 2020

深度学习下的释义识别：数据集和方法综述

本文回顾传统和现有的改进的改写识别方法，提出了改写的一种新分类体系。探究了这种类型在流行的数据集中的表现形式以及一些类型改写的不充分表示如何影响改写识别能力，最后提出了更有效地使用 AI 进行改写检测的未来研究方向和数据集。

Dec, 2022

改写可以躲避 AI 生成文本的检测，但究竟能否防御检索攻击？

通过语义相似的生成物和检测算法，该研究提出了一种简单的防御，以增加对 AI 生成文本的检测器对抗改写攻击的鲁棒性。

Mar, 2023

Par4Sim -- 文本简化的自适应改写技术

本研究开发了一个自适应学习系统用于文本简化，从使用数据中改进基于学习排序模型的性能，并通过实验结果表明，该系统在 NDCG@10 评估指标上的得分从 62.88％提高到 75.70％。这是首个使用使用数据对 NLP 组件进行自适应改进的研究。

Jun, 2018