- CVPR弱监督语义对应的概率变形一致性
本文提出了概率 Warp 一致性,用于语义匹配的弱监督学习目标。我们的方法直接监督由网络预测的密集匹配分数,并在概率分布中编码。我们通过应用已知的 Warp 构造图像三元组来推导出我们的概率学习目标,然后使用由此产生的图像三元组的约束来推导 - 多跳问答的语义句子组合推理
针对多跳领域问题,通过多段语义匹配模块(MSSM)和事实句子构成模块(FSC)的结合,提出了一种语义句子组成推理方法,其能提供更全面的上下文信息,实验结果表明该模型能结合现有的预训练语言模型,在 QASC 任务上的表现优于现有的 SOTA - 用于语义网络填充的多任务预训练语言模型
本文研究如何提高知识图谱的完整性,通过引入 LP-BERT 模型,并结合语义匹配以及数据增强的方法,实现了知识图谱补全任务的最新成果,优于现有最佳表现。
- 从多样化的物体场景组合中的零样本行为识别
本研究提出了基于物体和场景组成误差与多样性要求的无监督零样本动作识别方法,该方法不需要已训练的视频集,能够有效地提高动作识别效果。
- EMNLP从会话文本中检测话者的人设
通过建立一种名为 Speaker Persona Detection (SPD) 的新任务,利用基于自然语言处理的方法,检测出一段对话文本中的人物特征,进而更为准确地预测对话回应,并通过比较多组实验表明,该方法相对于现有的基线模型具有明显的 - KDD产品搜索中的语义匹配极端多标签学习
该论文旨在使用基于树的 XMC 模型来改善语义产品搜索,其中推理时间复杂度对于产品数量为对数级。使用 n-gram 特征进行层次线性模型并通过重量修剪使本方法具有灵活性,提高了 Recall@100,并在搜索结果中添加了多样性。
- KDD百度搜索中用于 Web 规模检索的预训练语言模型
本文描述了一种使用最新的中文预训练语言模型 ERNIE 开发和部署检索系统的方法,并通过离线和在线实验表明该系统性能良好,特别是对于那些查询需求不常见的查询,该检索系统可以大大提高搜索引擎的易用性和适用性。
- ACLCoSQA: 2 万 + Web 查询用于代码搜索和问题回答
通过引入 CoSQA 数据集,我们提出了一种名为 CoCLR 的对比学习方法,该方法的作用是作为一种数据增强器,以产生更多人工生成的训练实例,从而增强查询 - 代码匹配,实验表明,使用 CoSQA 进行训练可将代码问题回答的准确性提高 5. - EMNLP二值化稀疏表示实现高效文本检索的超高维度方法
本文提出了一种超高维度的表示方案,结合了符号和潜在形式的稀疏表示和神经模型的密集表示,具有直接可控的稀疏度,可以用于高效存储和搜索,并且在 MS MARCO 和 TREC CAR 数据集上得到了比其他稀疏模型更好的性能。
- ICCV无监督学习密集对应关系的变形一致性
本文提出了一种新的无监督学习方法 ——Warp Consistency,来解决实际图像匹配中出现的大外观变化的问题,并在多个有挑战性的基准数据集上取得了新的最高水平。
- ACL无监督的标签感知事件触发词和论元分类
本文提出了一种无监督事件抽取流程,使用先进的预训练语言模型并匹配语义,有效将事件映射到预定义的事件类型上,最终表现出色,成功地将 83% 的触发器和 54% 的参数映射到了正确类型。
- AAAIR$^2$-Net:面向句子语义匹配的关系双重学习网络
本研究提出了一种基于深度神经网络的 R2-Net 方法用于句子语义匹配问题,该方法利用 BERT 自动编码句子,设计了一个 CNN 编码器来捕获局部信息,并引入了一种自监督的关系分类任务来引导模型更好地提取关系信息,同时利用三元损失函数更好 - 视频语料库中的时刻定位层级多模态编码器
本文提出了一种名为 HAMMER 的 HierArchical Multi-Modal EncodeR 模型,通过在粗略的片段级别和细粒度的帧级别编码视频,从多个子任务中提取不同尺度的信息,从而解决了在未处理和未分段的视频中定位未定义段的挑 - ICMLMuSeM: 使用互惠注意力语义匹配检测不一致新闻标题
该研究提出了一种基于互相关注的语义匹配方法来检测新闻标题和内容之间的不协调,通过利用涉及的所有单词嵌入的差异,在两个公共可用数据集上显著优于现有技术。
- EMNLP动态语义匹配与聚合网络用于少样本意图检测
本文提出了一种基于多头自注意力和动态正则化约束的语义匹配聚合网络,为 few-shot 意图检测任务提供了更为有效的匹配方法,并在进行了广泛实验后证明了我们方法的有效性。
- GOCor: 将全局优化的对应体引入您的神经网络
GOCor 是一种完全可微的密集匹配模块,可取代特征相关层,在几何匹配、光学流和密集语义匹配任务中表现出优异性能。
- 用语义残留嵌入补充词汇检索
本论文提出了 CLEAR 模型,它采用神经嵌入匹配模型的语义匹配信号来补充传统的基于词汇精确匹配的模型,通过一种基于残差的嵌入学习方法,明确地训练嵌入来编码语言结构和语义,实验证明了 CLEAR 在终端到端的准确性和效率等方面相比于最先进的 - 超过 512 标记:Siamese 多深度变形金刚分层编码器用于长篇文档匹配
本文提出了一种用于匹配长文档的 Siamese Multi-depth Transformer-based Hierarchical(SMITH)编码器,来解决长文档匹配的语义匹配问题,该编码器包含多项创新来适应输入文本的长度,其中包括使用 - AAAI采用句子级语义匹配和答案位置推断来改善问题生成
本文提出了一个能够改进问题生成中的关键词生成和全局问题语义缺失问题的神经问题生成模型,并且利用了句子级别的语义匹配和答案位置推断功能,并运用了基于答案感知的门控融合机制来增强解码器的初始状态,结果表明我们的模型在 SQuAD 和 MARCO - 级联修订网络用于新物体字幕生成
本文介绍了一种使用层叠修订网络的图像标题生成方法,在未知物体出现时,利用外部知识(物体检测模型)进行修订,从而精确地描述图像。试验证明该方法在 MSCOCO 数据集和 ImageNet 数据集上效果显著。