海事问答系统的释义技术
利用释义学习问题表达的多样性来提高询问回答系统在 Freebase 和句子选择上的准确性。通过训练端到端来直接学习最有可能产生正确答案的语言表达,得到了有竞争力的结果。
Aug, 2017
该研究提出了一个自然语言生成系统,使用机器翻译和深度循环神经网络来生成语言交互和注释,并在 ASk 技能上评估其对 NLU 模型的影响,在未见过的技能中得到显着改善。
Jun, 2020
该研究提出了一种基于改写生成的方法,可以减少创建新对话代理所需要的时间和成本,同时提高其性能,使其能够实际与真实用户进行交互。实验证明该方法提高了意图分类模型的泛化能力,有助于在组织范围内规模化部署这项技术。
Apr, 2022
AutoQA 是一种方法和工具包,用于生成可以回答数据库问题的语义解析器,其可以自动生成训练集,并使用自动改写和基于模板的解析来查找不同词性中属性的替代表达方式,并使用一种新颖的过滤自动改写器来生成完整句子的正确改写。该工具应用于 Schema2QA 数据集和 Overnight 数据集,其回答正确率与使用专家自然语言注释和来自众包工人的改写数据训练的模型相当。
Oct, 2020
本文针对自然语言和逻辑形式之间的映射、基于众包的数据收集方式存在的问题进行了深入分析,提出了一种结合模型和众包技术的数据收集方法,以减轻众包方法带来的偏差,实验结果表明,该方法对于自然语言和逻辑形式解析的准确度相对更高。
Aug, 2019
本文介绍了一种基于语言约束的相似性搜索方法,用于自动产生大规模对齐语料库,以解决基于神经网络的释义生成面临的数据缺乏问题。该方法在意大利语的情况下进行评估,并使用基于指针的深度神经网络架构实验。
Feb, 2024
通过评估释义生成方法实现提高 FRANK 问答系统可回答的自然语言问题的多样性,该研究分析了 LC-QuAD 2.0 数据集上的自动度量和人工判断,并讨论了它们之间的相关性,同时对包含错误的数据点进行了错误分析。通过将最佳执行的释义生成方法(一种英 - 法反向翻译)模拟到 FRANK 中进行测试,作者得出两个主要结论:需要清理 LC-QuAD 2.0 数据以消除评估中的错误,而且由于 FRANK 的解析器存在限制,释义生成不是我们可以依赖的一种提高 FRANK 回答自然语言问题多样性的方法。
Jun, 2022
本文提出了一种从自然语言数据中自动构建概率性知识图谱的初始原型 ——Maritime DeepDive,利用该工具从海盗事件中提取概率事件,该工具的准确性和信心得到了验证。
May, 2023
本文介绍了一种语义解析方法,使用序列到序列模型将自然语言文本转化成 λ 演算表达式,并以 XML 格式进行解析,通过实验表明,该方法可用于机器人领域技术和非技术人员之间的交流。
Jan, 2023