从用户反馈中学习神经语义解析器
本文研究了使用自然语言反馈进行语义解析校正的任务,并构建了 SPLASH 数据集,证明这种反馈形式可以显著提高语义解析的准确性。
May, 2020
提出了一种利用模拟的自然语言反馈来训练交互式语义解析器的任务和新颖的反馈评估器,证明该反馈模拟器可以在低数据集情况下,生成高质量的自然语言反馈来提高特定解析器的错误纠正能力。
May, 2023
发展了一种从自然语言反馈中训练语义解析器的学习算法,为了使其直观可扩展性,该算法使用了用户纠正、会话记录等已有的自然语言数据作为监督信号,相对于使用严谨的逻辑形式或者特定答案的监督方法,可以接受那些并不熟悉语言形式的用户。研究还构建了一个自然语言反馈的对话数据集,并证明该方法对于从这些自然语言监督信号中学习语义解析器是有效的。
Feb, 2019
提出了一种利用自然语言反馈进行语义解析更正的方法,通过将任务的语义和语法困难分离,只需一轮自然语言反馈即可将文本到 SQL 解析器的准确性提高 26%;同时表明 T5-base 模型能在无需训练的情况下,纠正 T5-large 模型的错误。
May, 2023
本论文提出了一个新的交互式语义解析问题的统一形式,其中的目标是设计一个基于模型的智能代理。代理能够自主决定是否和何时需要人类干预,并生成自然语言的澄清问题,使用了世界模型并在两个 Text-to-SQL 数据集上得到了很好的效果。
Oct, 2019
本文介绍了一种通过用户直接学习语义解析器的 “人在循环” 方法,在此过程中,语义解析器应该自我观察其不确定性并在不确定时提示用户演示。为了解决演示稀疏性问题,提出了一种新颖的注释高效的仿真学习算法,该算法通过混合演示的状态和自信的预测来迭代地收集新数据集,并以数据集聚合的方式重新训练语义解析器,在 text-to-SQL 问题上表现良好。
May, 2020
本文介绍了一种神经语义解析器,可以将自然语言表达式映射到逻辑形式,以在特定任务环境中执行,如知识库或数据库,生成响应。解析器使用基于转换的方法生成具有树形结构的逻辑形式,结合由逻辑语言定义的通用树生成算法和领域一般性操作。解析器的生成过程由结构化循环神经网络建模,提供句子上下文和生成历史的丰富编码,以进行预测。为了解决自然语言和逻辑形式标记之间的不匹配,探讨了各种注意机制。最后,我们考虑了神经语义解析器的不同训练设置,包括全监督训练、弱监督训练和远程监督训练。对各种数据集的实验表明了我们解析器的有效性。
Nov, 2017
本文提出了一种基于领域本体的框架,通过生成人类可理解的自然语言模板,从而将自然语言句子转化为机器可读的含义表示;并解决了语义解析在大规模领域中由训练数据的获取以及模型推广的复杂度所面临的挑战,该框架在六个领域进行数据训练,证明了其能快速且低成本地进行语义解析。
Dec, 2018
本文提出了一种基于标记级精细化查询理解的通用、模块化的神经语义分析框架,包括命名实体识别器(NER)、神经实体链接器(NEL)和神经语义解析器(NSP),该框架联合建模查询和数据库,并基于动态生成的语法合成基于树结构的 SQL 查询。实验证明,该模型在 SQUALL 数据集上的执行准确率达到了 56.8%,超过了现有技术水平 2.7%。
Sep, 2022
使用自然语言处理和语义解析的方法,在数据库查询过程中引入智能化,以帮助商业用户能够直接查询数据库。同时增加了自动可视化框架使得产品可供商业使用。
Oct, 2022