大模型时代的视觉知识：回顾与展望

Apr, 2024

大模型时代的视觉知识：回顾与展望

Visual Knowledge in the Big Model Era: Retrospect and Prospect

Wenguan Wang, Yi Yang, Yunhe Pan

TL;DR视觉知识在人工智能中的重要性及其与认知心理学的关系的综述论文，强调了在大模型时代中视觉知识的机遇和独特作用。

Abstract

visual knowledge is a new form of knowledge representation that can encapsulate visual concepts and their relations in a succinct, comprehensive, and interpretable manner, with a deep root in →

visual knowledge knowledge representation cognitive psychology machine intelligence big model era

发现论文，激发创造

人工智能下的视觉知识发现：挑战与未来方向

本文介绍了融合人工智能 / 机器学习和可视化 / 视觉分析的新兴领域 —— 综合视觉知识发现。文章着重探讨了可视分析、可视化知识发现以及人工智能 / 机器学习的挑战和未来方向，并讨论了可视化在视觉人工智能 / 机器学习中的作用。此外，文章介绍了在视觉帮助下新兴的全 2D ML、自然语言处理以及多维数据中的人工智能 / 机器学习的进展。

May, 2022

基于显式知识的视觉问答推理

使用来自大规模知识库的信息来推理图片内容，解释推理过程并回答自然语言问题的视觉问答方法，比主流的长短时记忆方法更能回答复杂问题且表现明显更好，同时提供了数据集和协议来评估这类方法。

Nov, 2015

利用视觉知识在语言任务中：跨模态知识转移的中间预训练的实证研究

本研究探索了将视觉知识整合到语言模型中以填补现有文本信息中缺失的相关性和物体属性信息的空白。研究发现，视觉知识传递可以在低资源和完全监督设置下均有效提高预先训练的语言模型在需要视觉知识的下游任务中的性能。

Mar, 2022

视觉 - 语言智能：任务、表示学习与大模型

这篇论文从时间的角度对视觉语言智能进行了全面的调研，总结了三个时期的发展，包括特定任务方法，视觉 - 语言预训练方法和通过大规模弱标签数据增强的更大模型，并讨论了未来的发展趋势.

Mar, 2022

VIPHY：探究 “可见” 的物理常识知识

本研究使用自动管道方法研究了视觉 - 语言模型在获取 “可见” 物理知识方面的能力，并发现这些模型在物体颜色，大小和空间三个方面的表现与人类存在明显差距。而采用预训练的基线模型 (CapBERT) 可以取得更好的表现。

Sep, 2022

弥合意图鸿沟：知识增强的视觉生成

通过分析和识别现有生成模型所面临的关键挑战并引入人类见解、预训练模型、逻辑规则和世界知识等多种知识源，本文提出了一种知识增强的迭代优化框架用于视觉内容生成，其中引入了知识反馈模块来逐步改进生成过程，从而提高生成内容与用户意图之间的一致性。通过初步结果展示了所提框架的有效性，突显了知识增强型生成模型在意图一致内容生成方面的潜力。

May, 2024

CommonsenseVIS: 自然语言模型的常识推理能力可视化与理解

利用外部常识知识库将模型行为与人类知识对齐，并通过多层次可视化和交互式模型探索和编辑，帮助自然语言处理专家在不同场景中对模型的概念关系推理进行系统且可扩展的可视化分析。

Jul, 2023

深度学习知识的价值

本文提出了一种启发自可解释的机器学习的框架，该框架通过量化实验评估了数据量和估计范围对知识价值的影响，并阐明了数据和知识之间的复杂关系。这个模型无关的框架可以应用于各种常见的网络架构中，提供了对深度学习模型中先前知识作用的全面理解。同时，它还可以用于提高知情机器学习的性能，以及区分不适当的先前知识。

Jul, 2023

机器知识：全面知识库的创建和维护

这篇文章概述了创建和管理大型知识库的基本概念和实践方法，重点介绍了发现和规范实体及其语义类型、自动提取基于实体的属性以及构建开放架构和知识管理的方法。

Sep, 2020

因果推理遇见视觉表征学习：一项前瞻性研究

本文综述了现有的因果推理方法在视觉表征学习中的应用，探讨了当前方法和数据集的限制，并提出了因果推理算法基准的前景挑战、机会和未来研究方向，以更有效地实现可靠的视觉表征学习及相关应用。

Apr, 2022