- CVPR面向开放词汇物体检测的目标感知蒸馏金字塔
本研究提出了一种基于目标感知的提取知识框架 OADP,包括 OAKE 模块和 DP 机制,通过自适应变换目标提案和引入全局和块知识提取以弥补对象精炼中的信息缺失。在 MS-COCO 数据集上,该方法取得了显著的改进。
- MatKB:多晶材料合成工艺的语义搜索
本文提出了一种利用自然语言处理技术对材料科学进行知识抽取和检索的新方法,将来自超过 950 万篇研究文章的结构化知识自动挖掘出来,并整合到一个搜索引擎中,使材料科学家能够更精确地搜索有关特定材料、属性和实验的信息。
- 从语言模型中提取事实知识的微调理解
本文分析语言模型在事实知识提取中的应用,发现 finetuning 会造成一个负面现象 - Frequency Shock,导致模型预测能力下降,因此提出两种解决方案(模型混合和混合 finetuning),并验证实验表明这两种解决方案相比 - AAAI基于关键词导向的对话生成预训练模型
在对话生成领域,我们提出了一种基于关键词引导的自监督预训练方法 (KPT),该方法可以从对话数据中抽取关键词并构建两种不同的知识,以处理基于知识的生成任务,如对话行为,知识图谱和个人描述等。实验结果表明,KPT 在此类任务中具有优异的表现。
- EMNLPReSel:通过学习检索和选择从科学文本和表格中提取 N 元关系
我们研究从科学文章中提取 N 元关系元组的问题,我们提出了一种名为 ReSel 的方法来解决这个问题并且在三个科学信息提取数据集上得到了显著的优于现有基线的表现。
- 基于神经网络输出层分布的分类置信度估计
本文提出了一种基于 logit 值分布的神经网络分类模型的不确定性预测和置信水平估计方法,可用于知识提取过程中的预测筛选,并在关系提取、命名实体识别和图像分类等任务中获得显著的提高。
- 利用预训练语言模型和电子健康记录背景提取生物医学事实知识
通过在 EHR 笔记上下文中添加提示,我们设计了并验证了一系列实验,用于实现动态上下文下的生物医学语言模型内置知识库的任务。我们的实验表明,这些语言模型所具有的知识可以从 EHR 笔记的噪声知识中区分出正确的知识,这种区分能力也可以作为一个 - 使用迁移学习和拓扑数据分析进行对话术语提取
本文通过探索来自词嵌入、语言模型功能以及词嵌入空间的拓扑特征等不同特征,实现了系统以纯数据驱动的方式在对话中发现领域、插槽和值的实现,并在 Schema-Guided Dialogue 数据集中取得了优异结果,结果表明这种方法对本体论归纳以 - KEEP:一种在线推荐的工业级预训练框架,通过知识抽取和插入实现
本文提出了一种工业推荐系统中通过从超域中提取知识来改善数据稀疏问题的方法,并设计了一个基于监督预训练的知识提取模块和插入网络的 KEEP 框架以适应增量训练的在线推荐。实验证明,该方法取得了良好的效果,并且在阿里巴巴的展示广告系统中部署后带 - 面向计算连续体的智能医疗分布式机器学习
本文探讨了去中心化的分布式账本上机器学习模型对分布式电子个人健康档案进行知识提取的方法,并提出了一个设计概念,能够匿名进行预测性分析,结果表明可降低机器学习时间至 60%,一致性延迟低于 8 秒,适用于各个医疗机构。
- 基于词语混合和 GRU 的科技文本知识提取方法
本文提出了一种科技资源知识提取方法,基于单词混合和 GRU 模型,结合单词混合向量映射方法和自注意力机制,有效改善中文科技资源文本信息关系提取效果。
- CVPR基于时间特征对齐与互信息最大化的基于视频的人体姿态估计
本研究提出一种分层对齐框架,对多帧人体姿态估计问题进行了深入研究,利用视觉证据、知识提取和互信息等方法,在 PoseTrack2017、Sub-JHMDB 和 Pose-Track2018 等数据集上取得了最先进的性能表现。
- 低资源场景下的知识提取:调研与视角
该论文回顾和分类研究了在知识提取中的低资源情况中,利用高资源数据、更强模型、数据和模型相结合等三种方法进行的神经方法,并提出未来研究的方向和应用前景。
- 走向开放领域对话学习
本文提出修改对话系统,使其能够学习的方法,并讨论了如何从对话中提取知识、更新代理的语义网络并以行动和观察为基础。希望引起人们对该领域的关注,并成为未来研究的重点。
- AAAI利用二分模式挖掘半结构化点击流数据中的意图预测
通过约束推理,我们引入了一种半结构化数据的模式挖掘框架,可以发现频繁出现且具有所需特性的顺序模式,从而创建有用的新模式嵌入,进而用于客户意图预测。总的来说,我们证明了模式嵌入在半结构化数据和机器学习模型之间具有整合作用,提高了下游任务的性能 - EMNLPDeepKE:基于深度学习的知识抽取工具包,用于知识库填充
DeepKE 是一款开源的知识提取工具,支持复杂的低资源、文档级别和多模态场景。它实现了各种信息提取任务,包括命名实体识别、关系提取和属性提取。
- ACL知识性还是教育性猜测?重新审视语言模型作为知识库
本文对预训练掩码语言模型(MLMs)在不同抽取范式下的预测机制进行了研究,发现之前的良好表现主要归因于偏见提示和外部环境的贡献。实体类型引导和正确答案泄露是知识预测的改进方向。这些发现揭示了 MLMs 的预测机制,同时质疑了现有 MLMs - ACLCoRI: 集体关系整合与数据增强用于开放信息抽取
通过提取网页信息与知识图谱进行整合,本文研究通过整合自由文本中主题 - 关系 - 客体提取到的自由文本关系,并对接到目标知识图谱中相关关系以达到全球合一的目的,结果取得了可观的并显著优于基线的效果。
- ACLBERTese: 学习向 BERT 交流
本研究提出了一种自动将查询重写成 “BERTese” 的方法,该方法是直接针对更好的知识提取进行优化的,相比之前的方法表现更好,避免了复杂的流程,同时也提供了一些关于有助于语言模型进行知识提取的语言类型的见解。
- 复杂医疗问答中可解释的多步推理与知识提取
本文提出了一种名为 MurKe 的基于多步推理和知识提取的健康问答辅助系统,以应对复杂的健康医学问题。实验结果表明,该系统在 HeadQA 数据集上能够优于几个强基线。