机器推理的组合注意力网络

ICLRMar, 2018

Compositional Attention Networks for Machine Reasoning

Drew A. Hudson, Christopher D. Manning

TL;DR我们介绍了 MAC 网络，这是一种新颖的完全可分化的神经网络体系结构，旨在促进显式和表达推理。该模型通过将问题分解为一系列基于注意力的推理步骤来处理问题，并且通过 MAC 单元来执行每个推理步骤。该模型在视觉推理方面表现出强大、鲁棒和可解释性能力，同时需要比现有模型少 5 倍的数据来实现强大的结果。

Abstract

We present the mac network, a novel fully differentiable neural network architecture, designed to facilitate explicit and expressive reasoning

mac network neural network reasoning attention-based interpretability

发现论文，激发创造

在视频中扩展组合式注意力网络以进行社交推理

本论文提出了一种新的基于深度学习架构的社交互动推理方法，该方法利用了多步推理能力和注意力机制，并应用于多模式扩展。实验结果表明该方法可以更好地利用多模态输入并在 Social Video 问答任务中取得了 2.5% 的准确率提升。

Oct, 2022

历史推理：上下文感知的视觉对话

浅谈如何利用上下文感知机制增强 MAC 网络在视觉问答领域对话系统中的表现

Nov, 2020

可微分的自适应计算时间在视觉推理中的应用

本文介绍了一种新颖的基于注意力机制的自适应计算算法，称为 DACT，与现有算法不同，是端到端可微的。该算法可以与许多网络配合使用；特别地，我们研究了其在广泛使用的 MAC 体系结构中的应用，使所需的循环步骤数量显著减少，从而改善了其性能与计算比率。此外，我们还表明，通过增加所使用的最大步骤数，即使在 CLEVR 数据集中也能超越我们最佳的非自适应 MAC 的准确性，证明我们的方法能够控制步骤数而不会显著降低性能。我们的方法提供的额外优点包括通过丢弃无用的步骤，并提供对底层推理过程的更多见解，从而显着提高了可解释性。最后，我们将自适应计算呈现为模型集成的等价形式，类似于专家混合配方。我们的实验代码和配置文件均可用于支持这一领域的进一步研究。

Apr, 2020

记忆增强控制网络

该文章介绍了一种名为 Memory Augmented Control Network (MACN) 的神经网络，通过卷积特征提取、基于神经网络的规划和网络控制器学习，解决了计划问题和部分可观测环境下的推理问题，该网络在离散的网格世界环境中表现出了强大的求解和泛化能力。

Sep, 2017

基于堆栈神经模块网络的可解释神经计算

本研究提出一种新颖的神经模块化方法来实现基于组合推理的问题回答，该方法不需要强监督，能自动诱导期望的子任务分解并通过共享模块链接不同的推理任务，实验表明该模型比当前先进模型更易于人类评估者解释以及预测其中间结果的成功或失败。

Jul, 2018

AiR: 具有推理能力的注意力

本文提出 Attention with Reasoning capability (AiR) 框架，使用注意力机制来理解和改善导致任务结果的过程，并通过一系列原子推理操作定义了一个评估指标来量化考虑推理过程的注意力。作者收集了人类眼动和答案正确性数据，分析了各种机器和人类注意力在推理能力和任务绩效方面的影响，并提出了一种监督方法，共同逐步优化注意力、推理和任务绩效，以便模型通过遵循推理过程来查看感兴趣的区域。最后，作者证明了所提出的框架在分析和建模注意力方面有更好的推理能力和任务绩效。

Jul, 2020

基于认知启发的神经结构在视觉抽象推理中运用对比感知和概念处理

我们介绍了一种新的神经架构，用于解决视觉抽象推理任务，受到人类认知的启发，特别是人类抽象推理经常在感知和概念处理之间交替进行，作为一种灵活、迭代和动态的认知过程。我们介绍了如何使用矩阵推理问题来解释这种新的对比感知 - 概念网络（CPCNet）的工作方式，以形式化问题的思维。在机器学习数据集 RAVEN 上的实验证明，CPCNet 相比之前的所有模型具有更高的准确性，同时使用了最弱的归纳偏差。我们还指出了原始 RAVEN 数据集中的显著且以前未被注意到的类别不平衡问题，并提出了一个新的变体 RAVEN--AB-RAVEN，该变体在抽象概念方面更加平衡。

Sep, 2023

模块化混合注意力网络用于视频问答

多模态机器学习中的网络结构复杂，通过连接可重用且可组合的神经单元，可以以更直观的方式完成多模态机器学习任务的网络构建，同时通过参数共享大大减少了空间复杂度。

Nov, 2023

组合视觉推理基准测试

该论文介绍了一个新的视觉推理基准测试，Compositional Visual Relations (CVR)，以推动更加数据高效的学习算法的开发，并发现卷积神经网络比变压器架构在大多数数据方案上表现更好，但所有计算模型都比人类更不数据高效。

Jun, 2022

学习离散组合推理模块网络，用于视频字幕

本文提出了一种名为推理模块网络 (RMN) 的视觉推理方法，旨在为现有的编码器 - 解码器框架提供视频字幕生成的推理能力，RMN 包括三个复杂的时空推理模块和一个由 Gumbel 估算法训练的动态和离散模块选择器，并且在 MSVD 和 MSR-VTT 数据集上的广泛实验表明，所提出的 RMN 方法优于现有的方法，同时提供了一个明确和可解释的生成过程。

Jul, 2020