一种通用且灵活的多概念解析框架用于多语言语义匹配

Mar, 2024

一种通用且灵活的多概念解析框架用于多语言语义匹配

A General and Flexible Multi-concept Parsing Framework for Multilingual Semantic Matching

Dong Yao, Asaad Alghamdi, Qingrong Xia, Xiaoye Qu, Xinyu Duan...

TL;DRMCP-SM 提出了一个多概念解析的语义匹配框架，用于从句子中提取各种概念，并将其融入分类标记，以解决语义匹配中对命名实体识别模型的依赖问题。

Abstract

sentence semantic matching is a research hotspot in natural language processing, which is considerably significant in various key scenarios, such as community question answering, searching, chatbot, and recommendation. Since most of the advanced models directly model the semantic relev

sentence semantic matching dc-match keywords intents mcp-sm

发现论文，激发创造

文本语义匹配：以分离关键词和意图为特色的分治方法

本文提出了一种简单而有效的文本语义匹配训练策略，将关键词从意图中解离开来，可以与预训练语言模型 PLM 轻松结合，而且在三个基准测试中与各种 PLMs 相比具有稳定的性能提升。

Mar, 2022

用于问答系统中语义检索的多任务句子编码模型

本文提出了一个多任务句子编码模型 (MSEM) 用于 Paraphrase Identification（PI）问题。我们使用连接图表示句子之间的关系，并应用多任务学习模型来解决句子匹配和意图分类问题。此外，我们实现了一个通用的语义检索框架，结合了我们提出的模型和近似最近邻（ANN）技术，可以在在线服务中快速地找到最相似的问题。实验结果表明，我们提出的方法与现有的句子匹配模型相比具有优越性。

Nov, 2019

产品搜索中的语义匹配极端多标签学习

该论文旨在使用基于树的 XMC 模型来改善语义产品搜索，其中推理时间复杂度对于产品数量为对数级。使用 n-gram 特征进行层次线性模型并通过重量修剪使本方法具有灵活性，提高了 Recall@100，并在搜索结果中添加了多样性。

Jun, 2021

语义解析中的句子重写

提出了一种基于句子重写的语义解析方法，通过将句子重写为具有与其目标逻辑形式相同结构的新形式，有效解决了自然语言和目标本体之间的词汇不匹配问题。具体而言，针对两种常见类型的不匹配，提出了基于字典的 1-N 匹配和基于模板的 N-1 匹配的两种句子重写方法，并在语义解析基准数据集 WEBQUESTIONS 上评估了系统性能，实验结果表明，我们的系统在 F1 上比基础系统提高了 3.4％，并生成更准确的逻辑形式和更鲁棒的句法分析。

Jan, 2019

语义代码搜索的多角度架构

该研究提出了一种多角度跨语言神经框架用于代码 - 文本匹配，具备全球和本地相似性，结果比以往单映射空间的方法更好地完成了这一任务。

May, 2020

机器阅读理解的多角度上下文匹配

在 SQuAD 数据集上，我们提出了一种多角度上下文匹配模型，它是一种端到端系统，可以直接预测文本段落中答案的起点和终点。我们的模型通过使用双向 LSTM 来编码问题和加权段落，利用多个角度将文本上下文与编码问题进行匹配，并生成一个匹配向量，最终利用另一个双向 LSTM 汇总所有信息并预测起点和终点。在 SQuAD 测试集上，实验结果显示我们的模型达到了领先位置的竞争力。

Dec, 2016

多语言任务导向对话的情境语义解析

通过机器翻译自动翻译对话数据集并使用新的上下文语义解析模型，该方法在多个数据集上提高了准确性并创建了高准确度的多语言对话数据集。

Nov, 2021

鲁棒的增量神经语义图解析

该研究提出了一个基于神经编码器 - 解码器的转移句法分析器，可以作为关于最小递归语义的完全覆盖的语义图分析器，预测图与非词汇化谓词及其标记对齐共同。该分析器比注意力模型基准更准确，并且在 GPU 批处理方面比高精度基于语法的分析器快一个数量级。此外，我们的最小递归语义分析器的 86.69％ Smatch 得分高于 AMR 分析的上限，这使得 MRS 成为有吸引力的语义表示选择。

Apr, 2017

基于维基数据的多语义解析中的构成性泛化

本篇文章提出了一种基于 Wikidata 的多语言、平行的问句对数据集，即 Multilingual Compositional Wikidata Questions（MCWQ），用于分析语义解析器在英语、希伯来语、卡纳达语和汉语中的组合泛化能力。结果表明，即使使用最先进的预训练多语言编码器，跨语言组合泛化能力也无法实现，文章的方法、数据集和结果将有助于未来关于具有更现实和多样化背景下语义解析的研究。

Aug, 2021

跨域上下文依赖语义解析的动态混合关系网络

本文提出了一个动态图形框架，能够有效地建模上下文话语、令牌、数据库模式及其交互，并通过强大的重新排名模型进一步增强。该模型在 SParC 和 CoSQL 数据集上实现了新的最优表现。

Jan, 2021