融合弱监督和主动监督用于语义解析
本研究提出了一种在多个知识库上进行语义解析的框架,采用弱监督训练。通过多个特定于域的语义分析器(教师)训练一个统一的多域语义解析器(学生)来解决这一挑战。 在标准 Overnight 数据集上,相对于基线技术,该模型在指称准确性方面提高了 20%。
Jun, 2019
本研究提出了一种弱监督方法来训练文本到 SQL 解析器,利用 QDMR 结构自动合成 SQL 查询来代替 NL-SQL 注释,结果表明弱监督模型表现与有注释的 NL-SQL 数据训练模型相当,免除 SQL 注释。
Dec, 2021
发展了一种从自然语言反馈中训练语义解析器的学习算法,为了使其直观可扩展性,该算法使用了用户纠正、会话记录等已有的自然语言数据作为监督信号,相对于使用严谨的逻辑形式或者特定答案的监督方法,可以接受那些并不熟悉语言形式的用户。研究还构建了一个自然语言反馈的对话数据集,并证明该方法对于从这些自然语言监督信号中学习语义解析器是有效的。
Feb, 2019
本文针对半监督学习中 NL utterances 匹配 program 的任务,提出了一种新的方法 —— 鼓励 parser 为未标注 utterances 生成可执行的 program,并从后验正则化的角度提出了一组新的训练目标,实验显示这些新目标优于常规方法,使半监督和监督学习之间的差距缩小。
Apr, 2021
该文提出了一种主动学习方法,将小批量的人工翻译添加到机器翻译的训练集中,利用人工和机器翻译的优点,并提出了新颖的聚合获取准则来帮助方法选择要手动翻译的话语,实验证明这种理想话语的选择能显著降低翻译数据中的误差和偏见,从而比仅在机器翻译数据上训练的解析器具有更高的精度。
May, 2023
本文提出了一种基于神经网络的解析器 - 排序器系统用于弱监督语义解析,通过对表征的推理公式使用线索来生成候选的树结构逻辑形式,并对其进行排序,以此平衡正确执行和掌握语义的两个目标,进一步使用神经编码的词表注入领域知识,并在三个 Freebase 数据集上进行实验,获得了达到最先进水平的效果.
Aug, 2018
本论文提出了一种训练语义解析器的新方式,即利用抽象化表示,而非强监督方式(程序),以缓解训练过程中的困难。经实验证明,这种方法可以成功地用于处理视觉推理数据集以提升性能。
Nov, 2017