- 通过蒸馏将知识更新传递给 LM
文章介绍了建立语言模型的知识库的更新方法,通过上下文蒸馏的方式对实体进行继承知识,以良好的效果进行更新,而不会影响到性能。
- ACL基于知识库的空间碎片问题解答
本文提出一种基于 pipeline 分解方法的系统,能够回答复杂的自然语言查询,帮助工程师访问建模轨道空间碎片环境的知识库中的信息。该系统可以利用 GPT-3 生成的半合成数据和跨领域数据来进行训练,从而减少过拟合和快捷学习。
- DKAF: 基于知识库仲裁的任务导向对话系统学习中解决对话 - 知识库不一致性问题
该研究提出了一种使用对话 - KB 仲裁框架来学习具有对话 - KB 不一致的 TOD 代理的方法,该框架通过预测每个训练对话的最新的 KB 快照来减少对话 - KB 不一致,我们证明 TOD 代理训练的效果比现有基线模型更好。
- UFO: 通用常识问答的统一事实获取
通过 Unified Facts Obtaining (UFO) 方法使用大规模语言模型,获取事实并在各种常识问答方面进行推理,从而在各基准测试中显着提高推理模型的性能。
- 通过 Hard Expectation-Maximization 迭代改进生物医学实体链接和事件提取
本文提出了一种基于隐含变量的硬 EM 方法,联合进行生物医学实体链接和事件抽取,并通过 Genia 2011 和 BC4GO 两个基准数据集的实验结果展示了该方法在两个任务上均优于强基线模型。
- 在上下文学习中进行知识库问答的选择
该研究提出了一种基于 LLMs 的 McL-KBQA 框架,通过基于 ICL 的多选项将 LLMs 的 Few-shot 能力纳入 KBQA 方法,从而提高了 QA 任务的有效性和泛化性能。在两个 KBQA 数据集上的实验结果表明,McL- - 交互式自然语言处理
该论文对 iNLP 的定义、分类、评估方法、应用和未来研究方向进行了综合性调查,旨在为研究人员提供广泛的视野和工具,以促进与人类、知识库、模型和环境的交互、交流和合作。
- ACL零样式忠实事实误差校正
该论文提出了一种零 - shot 框架,用于纠正文本知识库中的事实错误,具有可解释性,并使用不同的方法进行度量,改善了已有的模型。
- ACLACCENT:面向开放域对话系统的自动事件常识评估度量
本文介绍了一种基于事件通识知识库的通识推理评估度量 ACCENT,通过提取对话中的事件关系元组,以知识库为基础来评估响应是否与常识相符,并通过构建公共数据集进行了评估,并证明 ACCENT 是事件常识评估的有效度量方法。
- 开放世界知识库中的完整性、召回率和否定性:一项调查
本文介绍了有关知识库的完整性、回溯和否定的表示、提取和推断的方法,以及对应的方法及其工作原理的基本方法,并针对两类受众提出了解决不完备知识库方面的建议。
- ACLCAT: 一种基于语境的通识推理的概念化和实例化框架
CAT 是一种语境化的概念归纳和实例化的半监督学习框架,可大规模概念化常识知识库,并通过实验证明,其获得的抽象常识知识可以显著提高常识推理建模的准确性。
- 知识库中实体解析和查询回答的结合框架
本文提出了一种新的框架,用于在具有元组生成依赖关系(tgds)和相等生成依赖关系(egds)作为规则的知识库(KBs)中结合实体解析和查询回答。该方法允许我们解决实体并绕过数据可能存在的不一致性,我们设计了一个适合这种新框架的 chase - 费米问题中的类别基数比较
挑战存在于类基数比较的答案很难研究,我们针对该问题,通过三个来源获取每个类别的绝对基数和正交子群的基数,提出了聚合信号的新技术,对包含 4005 对类的数据集进行评估,取得了 83.7% 的准确率。
- 基于知识的反事实查询在视觉问答中的应用
本文通过利用结构化知识库进行确定性、最优和可控的词级替换,以探究 VQA 模型行为的解释和鲁棒性,并从反事实的回答中提取局部和全局解释,发现可能的偏见和影响模型的性能的预期和意外模式,揭示了模型决策过程中的潜在偏见。
- WWWELH 概念的反事实解释
本研究提出首个在描述逻辑中生成反事实解释的算法,通过调整特征值来生成可被人类理解、人性化的解释,在用户调查和案例研究中证明其可行性。
- 检测知识库问题的可回答性:我的知识是否足够?
探讨知识库问答系统中基于知识库的不完整性所导致的问题,并提出了 GrailQAbility 数据集。测试两种最先进的知识库问答模型,发现两种模型无法准确检测和回答无法回答的问题,因此需要进一步研究使知识库问答系统能够克服这个问题。
- EMNLP将领域知识注入语言模型以用于面向任务的对话系统
本研究中,我们使用轻量级 adapters 来注入特定领域的知识以在 TOD 任务上进行微调,通过 KPRS 探测方法证明 adapters 对于对话生成任务有着优秀的表现。
- 知识库问答的比较研究
本文比较了六个知识库问答系统在八个基准数据集上的表现,研究了各种问题类型、属性、语言和领域,提出了一个高级的映射算法来帮助现有模型取得更好的结果,并开发了一个 COVID-KGQA 的多语言语料库来鼓励 COVID-19 研究和多语言多样性 - EMNLPUni-Parser: 知识库和数据库问答的统一语义分析器
本文介绍了 Uni-Parser,一种用于问答(QA)的统一语义解析器,旨在应对知识库(KB)和数据库(DB)中的结构化数据,通过引入原语的概念,使得候选逻辑形式数量线性增长,避免了指数级增长和泛化问题,并且实现了与原语不同操作的复杂逻辑形 - EMNLP视觉命名实体链接:一个新数据集和一个基准
本文提出了一个基于纯视觉的命名实体链接 (VNEL) 任务,其目的是仅基于图像识别出图像中的实体,并将其链接到知识库中的对应命名实体。同时,作者们还提出了三个不同的子任务,分别为 V2VEL、V2TEL 和 V2VTEL,针对不同类型实体,