海事问答系统的释义技术

Mar, 2022

Paraphrasing Techniques for Maritime QA system

Fatemeh Shiri, Terry Yue Zhuo, Zhuang Li, Van Nguyen, Shirui Pan...

TL;DR本文研究通过开发将人类自然语言自动翻译为机器可理解语言的能力，从而增强人机交流效率，重点是如何利用传统方法训练有限的数据集训练语义解析器，在海事领域的实验结果表明被翻译成 SQL 格式的语句和逻辑方面的形式是一种有用的训练数据集。

Abstract

There has been an increasing interest in incorporating Artificial Intelligence (AI) into defence and military systems to complement and augment human intelligence and capabilities. However, much work still needs to be done toward achieving an effective →

artificial intelligence defence human-machine partnership natural language semantic parser

发现论文，激发创造

学习改写以进行问答

利用释义学习问题表达的多样性来提高询问回答系统在 Freebase 和句子选择上的准确性。通过训练端到端来直接学习最有可能产生正确答案的语言表达，得到了有竞争力的结果。

Aug, 2017

神经机器翻译的释义生成

该研究提出了一个自然语言生成系统，使用机器翻译和深度循环神经网络来生成语言交互和注释，并在 ASk 技能上评估其对 NLU 模型的影响，在未见过的技能中得到显着改善。

Jun, 2020

利用释义生成快速启动对话系统

该研究提出了一种基于改写生成的方法，可以减少创建新对话代理所需要的时间和成本，同时提高其性能，使其能够实际与真实用户进行交互。实验证明该方法提高了意图分类模型的泛化能力，有助于在组织范围内规模化部署这项技术。

Apr, 2022

AutoQA：利用纯合成训练数据从数据库到问答语义解析器

AutoQA 是一种方法和工具包，用于生成可以回答数据库问题的语义解析器，其可以自动生成训练集，并使用自动改写和基于模板的解析来查找不同词性中属性的替代表达方式，并使用一种新颖的过滤自动改写器来生成完整句子的正确改写。该工具应用于 Schema2QA 数据集和 Overnight 数据集，其回答正确率与使用专家自然语言注释和来自众包工人的改写数据训练的模型相当。

Oct, 2020

不改写，检测！用于语义解析的快速有效数据收集

本文针对自然语言和逻辑形式之间的映射、基于众包的数据收集方式存在的问题进行了深入分析，提出了一种结合模型和众包技术的数据收集方法，以减轻众包方法带来的偏差，实验结果表明，该方法对于自然语言和逻辑形式解析的准确度相对更高。

Aug, 2019

通过自动爬取和对齐的句子对进行神经重述

本文介绍了一种基于语言约束的相似性搜索方法，用于自动产生大规模对齐语料库，以解决基于神经网络的释义生成面临的数据缺乏问题。该方法在意大利语的情况下进行评估，并使用基于指针的深度神经网络架构实验。

Feb, 2024

改写可以躲避 AI 生成文本的检测，但究竟能否防御检索攻击？

通过语义相似的生成物和检测算法，该研究提出了一种简单的防御，以增加对 AI 生成文本的检测器对抗改写攻击的鲁棒性。

Mar, 2023

研究在 FRANK QA 系统中使用释义生成进行问题改写的应用

通过评估释义生成方法实现提高 FRANK 问答系统可回答的自然语言问题的多样性，该研究分析了 LC-QuAD 2.0 数据集上的自动度量和人工判断，并讨论了它们之间的相关性，同时对包含错误的数据点进行了错误分析。通过将最佳执行的释义生成方法（一种英 - 法反向翻译）模拟到 FRANK 中进行测试，作者得出两个主要结论：需要清理 LC-QuAD 2.0 数据以消除评估中的错误，而且由于 FRANK 的解析器存在限制，释义生成不是我们可以依赖的一种提高 FRANK 回答自然语言问题多样性的方法。

Jun, 2022

面向海事领域概率知识图谱自动建设

本文提出了一种从自然语言数据中自动构建概率性知识图谱的初始原型 ——Maritime DeepDive，利用该工具从海盗事件中提取概率事件，该工具的准确性和信心得到了验证。

May, 2023

水下机器人语义分析助手

本文介绍了一种语义解析方法，使用序列到序列模型将自然语言文本转化成 λ 演算表达式，并以 XML 格式进行解析，通过实验表明，该方法可用于机器人领域技术和非技术人员之间的交流。

Jan, 2023