- 超越感知之门:视觉转换器表示对象之间关系
视觉变换器(ViTs)在各种情境下取得了最先进的性能,但在涉及视觉关系的任务中却展现出惊人的失误。本文从机械性可解释性的角度研究了 ViTs 用于执行抽象视觉推理的高层视觉算法,并通过一个关系推理任务的案例研究,发现 ViTs 通常表现出两 - 流媒体视频中的自监督式多角色社交活动理解
在这项研究中,我们提出了一种基于多演员预测学习的自监督方法,用于流媒体视频中的社交活动识别。通过使用视觉语义图结构,我们对社交互动进行建模,从而实现了关系推理,使其在具有最少标记数据的情况下具有鲁棒性表现。该方法在标准群体活动识别基准上取得 - 基于子图适应的少样本知识图谱关系推理
Few-shot Knowledge Graph Relational Reasoning has become increasingly important in natural language processing applicati - Transformer 中的位置编码初始化对关系推理的重要性
学习可学习的位置编码对关系推理任务的重要性进行研究,发现可学习的位置编码优于常用的其他位置编码,并且初始化对学到的表示和下游泛化性能有着重要影响。结果表明,在没有提供或无法确定真实位置的任务中,学习高性能和鲁棒性的位置编码对关系推理任务非常 - 多层感知器学习上下文
在这项研究中,我们发现多层感知器(MLPs)和密切相关的 MLP-Mixer 模型可以像 Transformer 模型一样有效地进行上下文学习,并且在一些涉及关系推理的任务中,MLPs 表现更优,这一结果挑战了以往对简单连通模型的一些假设。
- Pix2Code: 学习将神经视觉概念组合成程序
利用程序合成扩展到视觉关系推理,通过检索图像中的对象表征并合成关系概念,Pix2Code 提出了一个框架,解决了学习抽象概念的可视化学习领域的一些难题,如泛化性和解释性约束。
- 多智能体动态关系推理在社交机器人导航中的应用
通过系统的关系推理方法和轨迹预测,我们提出了一种适用于多智能体系统的社交机器人导航研究,通过该方法,在密集、互动场景中,在安全性、效率性和社交遵循性方面显著优于最强基准线。
- ICCVRLIPv2:关系式语言 - 图像预训练的快速扩展
提出了一个快速收敛的模型,通过引入不对称语言 - 图像融合机制,以稀疏的语言编码层促进更早和更深的门控跨模态融合,从而实现对大规模伪标记场景图数据的关系预训练的扩展。进行了大量实验,表明该模型在三个基准测试中均取得了最先进的性能。
- 使用预训练语言模型进行上下文类比推理
通过将人类语言与类比制造联系起来,我们使用大规模预训练的语言模型(PLMs)来支持人工智能系统的类比能力,将感知特征转换成语言形式,PLMs 展现出惊人的零 - shot 关系推理能力,并在 RPM 测试中接近监督的以视觉为基础的方法。
- 视频问答的视觉因果场景细化
本文提出一种名为 VCSR 的跨模态因果关系推理框架,通过因果分析发现视频中关键的因果事件,解决了现有视频问答方法在识别视觉证据和问题方面的失败。实验表明,该方法在视频问答中表现出卓越的性能。
- Cluster Flow:层次聚类层如何使深度神经网络更具抗攻击性、更接近人类和更容易实现关系推理
ClusterFlow 可以在卷积神经网络上运行,利用训练数据的多维分类和特征数据来构建类 / 特征的高超图,并通过三个任务展示 ClusterFlow 如何使现代深度卷积神经网络更具人类感性功能,以及 ClusterFlow 如何适用于非 - CVPR人物 - 物体交互检测的关系背景学习
本文提出了一种多路关系网络 (MUREN) 方法,通过人、物、交互标记的一元、二元、三元关系,在三个解码器分支之间进行丰富的上下文交换,学习全面的关系上下文,从而实现了在 HOI 检测的两个标准基准测试中实现了最先进的性能。
- IRRGN: 一种隐式关系推理图网络用于多轮响应选择
本文提出了一种隐式关系推理图网络来提高多轮对话中回复选择的推理能力,该模型通过 Utterance Relational Reasoner(URR)和 Option Dual Comparator(ODC)分别实现隐式提取依存关系和对选项进 - 度量引导下的蒸馏:从度量器到排序器和检索器的知识蒸馏,用于生成式常识推理
该研究提出了一种基于 Metric Distillation Rule 的常识句子生成方法,通过传递重要性知识来使检索预测结果更加一致并提高性能。
- EvolveHypergraph: 面向群体的动态关系推理预测轨迹
本文提出了一种群组感知的关系推理方法,命名为 EvolveHypergraph,通过推断动态演化的关系来预测多智能体轨迹,该方法在多个数据集上得到了最先进的性能,并提高了推理关系的可解释性和稳定性。
- ECCV关系推理实现的语义新颖性检测
本文提出了一种基于关系推理的新颖语义检测表示学习策略,旨在有效地识别未知的对象类别,并将其转化为可靠的开放集识别模型。
- ECCV关于存在于时空中的物体的视频对话交流
本研究提出了一种基于对象中心框架的视频对话系统,称为 COST,该系统支持神经推理和关系推理,通过对视频中对象轨迹的分解来支持基于对象的对话状态更新和推理,可实现高水平的语言生成。经 DSTC7 和 DSTC8 基准测试,COST 具有与最 - IJCAI集合互相依赖变换器:用于排列学习和结构预测的序列到序列神经网络
通过交互依赖组件提升了注意力机制在 neural set encoding 的处理能力,提出了一个新的神经网络模型叫做 Set Interdependence Transformer,可用于处理各种基于集合的序列任务,如句子排序等。
- ICLR使用加强和循环关系推理进行规则发现
本文介绍了 R5,一种基于强化学习的关系推理框架,可以在关系图数据上推理,从观察结果中明确挖掘成分逻辑规则,具有强大的系统性和稳健性,实验结果表明 R5 在关系预测任务中优于各种基于嵌入和规则归纳的基线,并在发现基本事实规则时达到高召回率。
- CVPRGroupNet: 多尺度超图神经网络用于具有关系推理的轨迹预测
本文提出了一种基于多尺度超图神经网络的方法,可用于预测交互行为,通过对群体行为的建模以及超图的学习,实现了针对 CVAE 系统的关系推理,同时在 NBA、SDD 和 ETH-UCY 等实际数据集上验证了模型的有效性及优越性。