一种通用且灵活的多概念解析框架用于多语言语义匹配
本文提出了一种简单而有效的文本语义匹配训练策略,将关键词从意图中解离开来,可以与预训练语言模型 PLM 轻松结合,而且在三个基准测试中与各种 PLMs 相比具有稳定的性能提升。
Mar, 2022
本文提出了一个多任务句子编码模型 (MSEM) 用于 Paraphrase Identification(PI)问题。我们使用连接图表示句子之间的关系,并应用多任务学习模型来解决句子匹配和意图分类问题。此外,我们实现了一个通用的语义检索框架,结合了我们提出的模型和近似最近邻(ANN)技术,可以在在线服务中快速地找到最相似的问题。实验结果表明,我们提出的方法与现有的句子匹配模型相比具有优越性。
Nov, 2019
该论文旨在使用基于树的 XMC 模型来改善语义产品搜索,其中推理时间复杂度对于产品数量为对数级。使用 n-gram 特征进行层次线性模型并通过重量修剪使本方法具有灵活性,提高了 Recall@100,并在搜索结果中添加了多样性。
Jun, 2021
提出了一种基于句子重写的语义解析方法,通过将句子重写为具有与其目标逻辑形式相同结构的新形式,有效解决了自然语言和目标本体之间的词汇不匹配问题。具体而言,针对两种常见类型的不匹配,提出了基于字典的 1-N 匹配和基于模板的 N-1 匹配的两种句子重写方法,并在语义解析基准数据集 WEBQUESTIONS 上评估了系统性能,实验结果表明,我们的系统在 F1 上比基础系统提高了 3.4%,并生成更准确的逻辑形式和更鲁棒的句法分析。
Jan, 2019
在 SQuAD 数据集上,我们提出了一种多角度上下文匹配模型,它是一种端到端系统,可以直接预测文本段落中答案的起点和终点。我们的模型通过使用双向 LSTM 来编码问题和加权段落,利用多个角度将文本上下文与编码问题进行匹配,并生成一个匹配向量,最终利用另一个双向 LSTM 汇总所有信息并预测起点和终点。在 SQuAD 测试集上,实验结果显示我们的模型达到了领先位置的竞争力。
Dec, 2016
该研究提出了一个基于神经编码器 - 解码器的转移句法分析器,可以作为关于最小递归语义的完全覆盖的语义图分析器,预测图与非词汇化谓词及其标记对齐共同。该分析器比注意力模型基准更准确,并且在 GPU 批处理方面比高精度基于语法的分析器快一个数量级。此外,我们的最小递归语义分析器的 86.69% Smatch 得分高于 AMR 分析的上限,这使得 MRS 成为有吸引力的语义表示选择。
Apr, 2017
本篇文章提出了一种基于 Wikidata 的多语言、平行的问句对数据集,即 Multilingual Compositional Wikidata Questions(MCWQ),用于分析语义解析器在英语、希伯来语、卡纳达语和汉语中的组合泛化能力。结果表明,即使使用最先进的预训练多语言编码器,跨语言组合泛化能力也无法实现,文章的方法、数据集和结果将有助于未来关于具有更现实和多样化背景下语义解析的研究。
Aug, 2021
本文提出了一个动态图形框架,能够有效地建模上下文话语、令牌、数据库模式及其交互,并通过强大的重新排名模型进一步增强。该模型在 SParC 和 CoSQL 数据集上实现了新的最优表现。
Jan, 2021