学习改写以进行问答

EMNLPAug, 2017

Learning to Paraphrase for Question Answering

Li Dong, Jonathan Mallinson, Siva Reddy, Mirella Lapata

TL;DR利用释义学习问题表达的多样性来提高询问回答系统在 Freebase 和句子选择上的准确性。通过训练端到端来直接学习最有可能产生正确答案的语言表达，得到了有竞争力的结果。

Abstract

question answering (QA) systems are sensitive to the many different ways natural language expresses the same information need. In this paper we turn to paraphrases as a means of capturing this knowledge and prese

question answering paraphrases neural scoring model freebase sentence selection

发现论文，激发创造

通过自动爬取和对齐的句子对进行神经重述

本文介绍了一种基于语言约束的相似性搜索方法，用于自动产生大规模对齐语料库，以解决基于神经网络的释义生成面临的数据缺乏问题。该方法在意大利语的情况下进行评估，并使用基于指针的深度神经网络架构实验。

Feb, 2024

研究在 FRANK QA 系统中使用释义生成进行问题改写的应用

通过评估释义生成方法实现提高 FRANK 问答系统可回答的自然语言问题的多样性，该研究分析了 LC-QuAD 2.0 数据集上的自动度量和人工判断，并讨论了它们之间的相关性，同时对包含错误的数据点进行了错误分析。通过将最佳执行的释义生成方法（一种英 - 法反向翻译）模拟到 FRANK 中进行测试，作者得出两个主要结论：需要清理 LC-QuAD 2.0 数据以消除评估中的错误，而且由于 FRANK 的解析器存在限制，释义生成不是我们可以依赖的一种提高 FRANK 回答自然语言问题多样性的方法。

Jun, 2022

ParaQA: 单轮问答对话的同义答案问答数据集

本文介绍了 ParaQA 数据集，它是一个用于基于知识图谱单轮会话的多重释义响应问答（QA）数据集。ParaQA 数据集包含 5000 个问题 - 答案对，每个问题有 2 至 8 个不同的释义响应。我们提供了基准模型，并通过 BLEU 和 METEOR 等常用度量表说明了具有多个释义响应的优势。 ParaQA 数据集可在一个持续的 URI 上公开获得，以便在研究社区中广泛使用和适应。

Mar, 2021

一个用于释义生成的深度生成框架

本篇论文研究了一种使用深度生成模型（VAE）与序列到序列模型（LSTM）相结合的方法来自动生成给定句子的同义句，相对于现有方法具有更好的性能和简洁的模块化结构。

Sep, 2017

利用释义生成快速启动对话系统

该研究提出了一种基于改写生成的方法，可以减少创建新对话代理所需要的时间和成本，同时提高其性能，使其能够实际与真实用户进行交互。实验证明该方法提高了意图分类模型的泛化能力，有助于在组织范围内规模化部署这项技术。

Apr, 2022

海事问答系统的释义技术

本文研究通过开发将人类自然语言自动翻译为机器可理解语言的能力，从而增强人机交流效率，重点是如何利用传统方法训练有限的数据集训练语义解析器，在海事领域的实验结果表明被翻译成 SQL 格式的语句和逻辑方面的形式是一种有用的训练数据集。

Mar, 2022

神经机器翻译的释义生成

该研究提出了一个自然语言生成系统，使用机器翻译和深度循环神经网络来生成语言交互和注释，并在 ASk 技能上评估其对 NLU 模型的影响，在未见过的技能中得到显着改善。

Jun, 2020

简单有效的半监督问答

本研究提出一种利用基础文档和少量标注数据进行深度学习提取式问答的方法，并通过对三个不同领域数据集的实验验证了其有效性。

Apr, 2018

意图保持改写的意义和形式分解

本文提出一种方法，使用变分自动编码器将问题表示为一个潜在编码空间，从而解决了语义保留和句法创新之间的平衡问题，并使用分类器和 Vector-Quantized 变分自动编码器选择不同的表面形式进行英语问题的改写。

May, 2021

深度强化学习的释义生成

本文提出了一种基于深度强化学习的新型 “生成器” 和 “评估器” 框架来生成给定句子的释义，实验证明此方法在自动评估和人类评估上都优于现有技术。

Nov, 2017