- 科学中隐藏的引用削弱真正的影响力
通过对每篇论文的全文应用无监督可解释的机器学习方法,系统地识别出隐藏的引文,发现对有影响力的发现来说,隐藏的引文数量超过引文计数,不受出版渠道和学科的影响。隐藏的引文数量取决于论文内对该主题讨论的程度,表明对于标准的文献计量分析而言,讨论得 - 知识图谱的演变:调查和展望
知识图谱是多样化知识的结构化表示方式,广泛应用于各种智能应用。本文综述了各种类型的知识图谱(静态、动态、时态和事件型)的演化以及知识提取和推理技术,并介绍了不同类型知识图谱的实际应用,包括金融分析的案例研究。最后,我们提出了关于知识工程未来 - 基于 ModelOps 的智能医疗知识提取框架
基于 ModelOps 的智能医学知识提取框架,通过多层回调函数的数据集抽象机制、可重用的模型训练、监控和管理机制,以及基于数据集相似性的模型推荐方法,提供了低代码系统,方便医学研究者开发模型,并简化了非人工智能专家如医生对模型的访问。
- 通过期望最大化推理生成医疗问答中的解释
提出了一种新的方法来为医疗问答系统预测的答案生成自然语言解释,通过提取医学教科书中的知识来增强解释的质量,实验证明了该方法在处理文本证据时的有效性。
- SIGIR社交媒体时尚知识提取
社交媒体在时尚行业中起到了重要作用,本论文研究了社交媒体时尚知识抽取任务,将其作为一个描述问题来处理,旨在从社交媒体帖子中直接生成基于句子的时尚知识。
- 语言模型的物理学:3.1 部分,知识存储与提取
通过对半合成的传记数据进行深入研究,我们发现大语言模型的知识提取能力与训练数据的多样性之间存在着关联,同时通过 (几乎) 线性推测发现模型是否线性地编码实体名称的隐藏嵌入中的知识属性,或者在训练文本中其他标记的嵌入之间存在着强相关性。
- 基于逻辑查询的神经符号推荐模型
我们提出了一种神经符号推荐模型,将用户历史交互转化为逻辑表达式,并将推荐预测转化为基于这个逻辑表达式的查询任务。通过神经网络的模块化逻辑操作计算逻辑表达式,并构建隐式逻辑编码器合理降低逻辑计算的复杂性,实验证明我们的方法在三个著名数据集上相 - AAAI利用语言模型作为认知代理的知识来源
利用大型语言模型作为认知系统的任务知识、认知代理和知识提取,以及通过整合提取与认知架构能力来提高知识提取效果的挑战和机会。
- 进入单细胞多元宇宙:生物医学文本中的程序化知识提取的端到端数据集
FlaMB'e 是一个专家策划的数据集合,包含了生物医学文本中多个互补任务,捕捉了程序化知识的过程,提供了生物医学研究领域中最大的手工命名实体识别和消岐数据集。
- 大型语言模型向人类类似的概念组织收敛
大型语言模型在知识提取、推理和对话方面显示出与人类相似的表现,但是它们的表现究竟是通过记忆和模式匹配来解释的,还是反映了人类般的推理语义和世界知识,存在争议。本文展示了大型语言模型学习以类似于知识库的方式组织概念,这些知识库提供了推理语义和 - 利用连续时间贝叶斯网络分析级联的复杂系统
基于连续时间贝叶斯网络的建模框架用于分析复杂系统中的级联行为,识别可能导致级联行为的潜在哨兵状态,并提供塑料的图形表示和可解释的结果。
- LLMs4OL:用于本体学习的大型语言模型
我们提出了 LLMs4OL 方法,利用大型语言模型(LLMs)进行本体学习(OL)。通过全面评估使用零训练样例提示方法,我们发现 LLMs 可以有效地应用其语言模式捕捉能力于 OL,该能力包括从自然语言文本中自动提取和结构化知识。评估涵盖了 - 基于生成型 AI 的科学文献的极限摘要,提升初级卫生保健工作流程
运用生成型人工智能技术对科学论文的摘要进行总结,以减轻基层医疗人员的认知负担并提高文献阅读效率。研究结果表明,使用生成型人工智能生成的短摘要可显著降低回答与摘要内容相关问题所需时间,但在无完整摘要可用的情况下,提取知识的准确性明显降低,需要 - 癌症临床实践指南的自动知识建模
该研究提出了一种从国家综合癌症网络(NCCN)的临床实践指南中提取知识并生成结构化模型的自动化方法,并且采用了三种丰富策略来增强模型以实现程序化遍历和查询癌症护理指南。研究使用支持向量机(SVM)模型进行节点分类,并以 10 折交叉验证的方 - 相关实体选择:通过零样本类比修剪引导知识图谱引导
本文提出了一种基于类比推理的方法来构建知识图谱,该方法通过从感兴趣的种子实体开始,保留或修剪它们的相邻实体来逐步增加知识图谱,结果表明该方法在特定数据集和迁移学习中表现出较高的性能和泛化能力。
- GPT4Graph:大型语言模型是否能理解图形结构数据?实证评估和基准测试
本文研究了在十个不同的任务中评估大型语言模型在理解图形数据方面的能力,发现目前模型仍存在理解图结构和执行相关推理任务的局限性,需要进一步的研究以加强其图形处理能力。研究结果为搭建语言模型与图形数据理解之间的桥梁提供了宝贵的见解,为更有效的图 - CVPRMIANet:聚合无偏实例和通用信息进行少样本语义分割
提出了一种多信息集成网络(MIANet),它有效地利用了一般知识和实例信息进行准确的分段,通过多种信息聚合,MIANet 高效地利用了语义词嵌入和实例信息,最终提高了 PASCAL-5i 和 COCO-20i 数据集的性能并取得了新的最佳效 - 构建和服务大型开放领域知识图谱
本文介绍了基于领域知识图谱的 Saga 平台,包括训练知识图谱嵌入和创建语义注释服务,以及使用注释 Web 文档来驱动开放领域知识抽取。同时,我们还描述了构建和处理个人知识的平台适应。
- 拓扑深度学习架构:拓扑神经网络综述
Topological Deep Learning 解决复杂系统数据处理与知识提取的框架,但目前 Topological Neural Network 研究缺乏统一的符号和语言。本文提供对 TDL 可访问的介绍,并使用统一数学和图形符号比较 - 用结构化提示问询和递归语义抽取(SPIRES):一种使用零样本学习填充知识库的方法
SPIRES 是一种基于大型语言模型的知识提取方法,使用零 - shot 学习和通用查询回答,以根据特定模式返回信息,支持知识管理和获取的手动曲调。