- IJCAIScriptWorld:学习程序化知识的文本环境
介绍了一种名为 ScriptWorld 的基于文本的环境,用于教授智能代理关于日常家务事的现实世界常识知识,实验表明,从预训练的语言模型获取的先前知识有助于解决现实文本游戏环境。
- ACL增量提示和验证的开放域层次事件模式归纳
通过利用大型语言模型,将事件图谱识别为一种常识性知识形式,并提出一种增量提示和验证方法,可以直接处理事件之间的层次关系和时间关系。相较于其他方法,可以提高 F1 值。
- 使用生成翻译技术映射和清理开放通识知识库
本文提出了一种基于生成式翻译的方法,通过训练语言模型,将开放式知识库映射到现有知识库的固定模式中,以此解决了开放式知识抽取中存在的问题。实验证明,该方法在传统方法和生成式知识库构建之间找到了一个甜点,并且在避免后者的相关性噪声的同时,比前者 - ACL动态注入常识知识提高共情式对话生成效果
本文提出了一种新颖的共情回应生成方法,该方法将自适应模块应用于常识知识选择,以确保生成的共情回应与说话者的情境一致,并使用所选知识来完善常识认知和共情表达以生成更一致和共情的回应。实验结果表明,与基准模型相比,我们的方法在自动和人类评估方面 - 在 GPT 中编辑常识知识
该研究提出了 $MEMIT_{CSK}$,它是一种适用于常识知识的记忆编辑方法,并在 GPT-2 Large 和 XL 中进行了实验,优于调参方法 10.97%和 10.73% F1 分数。结果表明,通过直接编辑模型来校正和定制模型行为,结 - CADGE:基于图结构知识聚合的上下文感知对话生成
本文提出一种基于上下文感知的图注意力模型 (Context-aware GAT),可以在知识聚合流程中有效地整合相关知识图的全局特征,并且优于传统基于图神经网络 (GNNs) 的语言框架。
- Vera: 通用常识语句可信度估计模型
本研究使用 Vera 模型对~7M 的通用常识语句进行训练,并结合三个训练目标,成功实现了通用常识判别。经验证,该模型可用于过滤 ChatGPT 等模型产生的错误常识语句,且具有较强的泛化能力。
- ChatGPT 是一个具有知识但缺乏经验的求解器:大型语言模型中常识问题的研究
研究 LLMs 和 GPTs 在处理常识问题中的表现,实验结果表明:(1) GPTs 在通识任务中可以取得较好的 QA 准确率,但仍然较难处理某些类型的知识。(2) ChatGPT 具有常识知识,可以利用知识提示正确生成大部分常识知识。(3 - 基于常识知识辅助的资源受限和细粒度目标检测的深度学习
本文介绍了一种在边缘计算等资源受限情况下的细粒度图像目标检测方法,采用共识知识推理模块辅助轻量级粗粒度目标检测器获得准确的细粒度检测结果,并在多个现代深度学习检测器上进行实验验证。
- CVPR基于物体中心预测模型的内在物理概念发现
本文介绍了一个无需监督训练的系统 PHYsical Concepts Inference NEtwork (PHYCINE),该系统可以发现和表示物理概念,包括物质和电荷,并且使用这些变量来获得比仅使用可见对象特征更好的因果推理性能。
- CLICKER: 基于关注的跨语言常识知识转移
提出了 CLICKER 框架,通过将非常识知识与常识知识区分开来,最小化了英语和非英语语言在常识问答任务中的性能差距,实验结果表明 CLICKER 对于非英语语言的跨语言常识推理任务取得了显着的改进。
- CK-Transformer:基于常识知识的 Transformer 模型用于指代表达理解
本研究提出了一种基于常识知识增强的 Transformer 框架 (CK-Transformer) 用于图像中多模态指称表述的理解,实验结果表明 CK-Transformer 在 KB-Ref 任务上实现了一项新的最优表现,相比现有技术提高 - AAAI基于常识的提示控制共情对话生成
该研究提出一种新的框架,通过口头提示和策略驱动的未来鉴别器来融合常识知识并控制对话生成,从而改善预训练语言模型的共情式对话生成性能。实验证明,社会常识知识的融合和生成控制的强制执行有助于提高性能。
- 基于软通识约束的零样本目标导航探索
本文提出了一种基于预训练模型和通识知识转移的全新的零样本目标导航方法,将通识知识转化为导航行为的软逻辑谓词,实现了在未知环境中的目标导航,并获得了比其他基线模型更好的实验结果。
- EMNLP基于视觉常识的人类中心 grounding 中的人物查找
该研究介绍了一个新的人类常识任务,人类中心共识基础,并创建了一个数据集 HumanCog,并开发了一种强有力的基线方法,强调了丰富的视觉常识和多模式集成的重要性,并提出了未来的工作方向。
- AAAI因果情感蕴涵的知识桥接因果交互网络
本论文提出了利用常识知识作为桥梁的 Causal Emotion Entailment 方法,其中知识被用作三个桥梁,通过增强的图注意模块提取深层次的对话上下文信息,以及情感和行为相关的常识知识作为情感和动作相关的桥梁,使模型在情感识别方面 - AAAI利用背景知识进行交通情境的鲁棒推理
本文讨论交通理解的文本方法,采用三种基于知识的方法进行针对交通情境的零 - shot 问答,在大量语料库和知识图中提取常识知识。作者构建两个文本多项选择问答集来评估交通领域的因果推理和类似于人类驾驶执照测试的领域知识,其中 Unified- - FolkScope: 基于意图的知识图谱构建为目的的电子商务常识发现
本论文提出了 FolkScope—— 基于知识图谱构建的意图知识框架,借助大规模语言模型的生成能力和人机交互的标注,半自动地构建知识图谱,显现人类在电子商务平台购买商品过程中的意图结构,讨论了其内在质量和外部应用,证明其能够很好地模拟常识性 - ACL评估自然语言处理模型对可行性的理解能力:“约翰 50 岁,他的儿子可以是 65 岁吗?
本文介绍了一个问题回答数据集 FeasibilityQA,并通过该数据集测试了 GPT-3,GPT-2 和 T5 等最先进的模型回答可能性问题的能力。研究表明,即使提供相关的知识陈述,这些最先进的模型对可能性问题的正确回答率仍然很低,这使人 - 大规模提取文化常识知识
本文提出了一个用于在大规模上提取高质量文化常识知识 (CCsk) 的端到端方法,名为 CANDLE,该方法从 Web 语料库中提取 CCsk 断言并将它们组织成相符的类群,包括地理、宗教、职业等 3 个领域,多个文化方面。通过分类过滤和趣味