对话式语义解析
本文提出了一种基于层级标注的语义解析方案,能够有效且准确地分析复杂的组合查询,同时发布了包含 44000 个标注查询的数据集,并证明此方案在标准句法分析模型上的表现优于序列到序列的方案。
Oct, 2018
本文提出的基于 seq2seq 的模型结构,可以在零样本或少量样本的情况下,通过对新领域的元数据进行编码,自动实现领域自适应的语义解析,并通过在 Wikidata 上预训练以增强概念感知能力,从而在 TOPv2 和 SNIPS 数据集上优于以前的研究成果。
Jan, 2023
本研究探讨了使用预训练去噪序列到序列模型(即 BART)生成神经语义分析的合成数据的可能性,并使用辅助解析器(AP)过滤生成的数据,结果表明这一方法在导航领域的 Facebook TOP 数据集上具有潜力。
Nov, 2020
本文针对基于任务导向的对话提出了基于分层表示的语义分析方法,并通过嵌入上下文、集成学习和基于语言模型的成对重新排名等三种不同的改进方式来优化模型,将可能存在的分层表示错误进行分类,并展示了三种方法分别纠正不同类型的错误,进而通过将三种技术相结合,提高了 6.4%的准确度和 33%的错误率降低,使其在 TOP 数据集上首次实现了最新的状态 - of-the-art 结果。
Feb, 2019
本文提出使用树状结构的语义表示来改进对话系统中基于任务的自然语言生成问题,并介绍了一个挑战性的数据集,并展示了基于此表示的编码方法以提高语义正确性的结果。
Jun, 2019
本文介绍了使用自然语言处理技术的语义解析器,将用户的自然语言问题转化为有形式定义的查询语句,通过大规模知识图谱实现。作者提供了一个数据集,其中,用户问题采用 Sparql 语言解析,并对执行结果对系统回答进行注释。通过两种不同的语义解析方法,我们提出了挑战:如何处理大规模词汇,如何建模对话语境,如何处理多实体查询语句,并实现对新问题进行泛化。作者希望我们的数据集能够为开发会话式语义解析器提供有效的测试平台。本文的数据集和模型已经发布,详情请见链接。
Jan, 2023