通过符号化注意层发现具有预测性的关联物体符号

Sep, 2023

通过符号化注意层发现具有预测性的关联物体符号

Discovering Predictive Relational Object Symbols with Symbolic Attentive Layers

Alper Ahmetoglu, Batuhan Celik, Erhan Oztop, Emre Ugur

TL;DR我们提出并实现了一种新的深度学习体系结构，用于在桌面环境中，基于机械臂机器人与多个对象的自监督连续交互，发现对象及其关系的符号表示。

Abstract

In this paper, we propose and realize a new deep learning architecture for discovering symbolic representations for objects and their relations based on the self-supervised continuous interaction of a manipulator

deep learning architecture symbolic representations self-supervised learning relational symbols object-object relations

发现论文，激发创造

DeepSym: 无监督连续机器人交互的深度符号生成与规则学习用于规划

该研究提出了一种基于行为细分、离散对象与效果类别的概率规则方法来进行非平凡的行为规划，并在机器人操作中实现了多步对象操作。

Dec, 2020

基于图神经网络的符号关系深度强化学习

通过图神经网络和自回归策略分解，构建了一个深度强化学习框架，在多样化场景下表现出了出色的竞争能力和卓越的零 - shot 泛化能力.

Sep, 2020

pix2rule: 端到端的神经符号规则学习

本文提出了一种完整的神经符号方法，用于以端到端的方式将图像处理为对象，并在学习关系和逻辑规则方面。主要贡献是以可微分层为基础，从而可以通过剪枝和阈值确定符号关系和规则。我们使用两个数据集进行模型评估：符号规则学习的子图同构任务和学习对象，关系和规则的复合关系的图像分类域。结果表明，该模型超越最先进的符号学习者并优于深度关系神经网络架构。

Jun, 2021

面向通用机器人学习的深度目标中心表示

本文提出了一种方法来解决复杂开放环境下机器人操作的问题，该方法基于先前训练的通用视觉模型作为感知系统的对象先验，并引入了一个基于对象的注意机制来确定相关对象，通过少数轨迹或演示将这些对象纳入学习策略，使用强化学习可以学习多种操作任务。

Aug, 2017

从奖励中学习关系规则

本文通过关系强化学习来理解认知系统如何选择在特定任务中有用的特征关系以及如何利用这些表达来有效地与环境交互。我们使用建立在 RRL 中开发的函数逼近器的简单模型来展示我们的方法的潜力，并在需要考虑日益增多的潜在关系的三个 Atari 游戏中进行了训练和测试。在每个游戏中，我们的模型能够选择适当的关系表达式，并逐步建立关系策略。我们探讨了本模型与关系和类比推理模型之间的关系，以及其限制和未来的研究方向。

Mar, 2022

从纠缠的场景表示中发现对象及其关系

本文引入的关系网络（RNs）- 一种通用的神经网络架构，可用于从场景描述数据中学习对象关系，并从变分自编码器提供的场景图像的分布式深度表示中分离出错综场景描述输入的对象。

Feb, 2017

学习神经符号程序用于语言引导机器人操控

通过一种模块化结构，使用符号推理构造深度物体中心推理模型，从而训练出一种可以执行机器人操作的模型，此模型具有优秀的通用性和端到端的可训练性。

Nov, 2022

一种明确关系的神经网络架构

该研究旨在弥合深度学习和符号 AI 之间的差距，提出了一种新型的端到端神经网络架构，可以从原始像素数据学习形成具有显式关系结构的命题表示。通过评估和分析体系结构，引入了一系列不同复杂度的简单视觉关系推理任务。结果表明，预先训练这种任务的课程，可以学习生成可重复使用的表示形式，在比较多个基线架构后更好地促进了先前未见过的任务的后续学习。最后，研究者通过可视化成功训练过的模型的工作方式，揭示了体系结构的功能。

May, 2019

符号问题上通用强化学习的关系抽象

本文介绍了一种新的强化学习方法，利用关系抽象和深度学习，学习符号状态空间中可推广的 Q 函数，并能在零阶转移下转移到不同的相关问题，实现对大规模问题的有效知识迁移。

Apr, 2022

基于神经符号方法的交互指令跟随模型的物体和指令变化鲁棒性改进

通过提出神经符号化方法，将高级符号特征用作中间表征，来解决自然语言指令和第一视角视觉映射到与 3D 环境中对象进行交互的操作序列时神经网络特征提取对小的改变过于敏感而未能适应测试集中未见过的属性和指令的问题。在 ALFRED 基准测试的子任务评估中，我们的实验结果表明，和端到端的神经模型相比，我们的方法在切换对象、拿起对象和切片对象的成功率等未知环境下的交互任务中显着优于前者 9 点，46 点和 74 点。

Oct, 2021