关联预测：面向强化学习任务无关的知识表示

Dec, 2022

关联预测：面向强化学习任务无关的知识表示

Relate to Predict: Towards Task-Independent Knowledge Representations for Reinforcement Learning

Thomas Schnürer, Malte Probst, Horst-Michael Gross

TL;DR通过引入归纳偏置和语义模块，将观察空间分解为对象，并以语义表征和动态知识进一步分解，提高了模型的解释性和泛化性，且实验表明，知识分离的明确程度与学习速度、准确性和解释性相关。

Abstract

reinforcement learning (RL) can enable agents to learn complex tasks. However, it is difficult to interpret the knowledge and reuse it across tasks. inductive biases can address such issues by explicitly providin

reinforcement learning inductive biases object-centered approaches semantic representations knowledge separation

发现论文，激发创造

人类和机器在物理建设中的关系归纳偏倚

本研究探讨当下深度学习系统在处理物体分类、语言处理及游戏上表现出色，但却不能构建或修改建筑块等复杂系统，我们认为这是由于这些系统缺乏 “关系归纳偏置”，即一种可以推理物体间关系并根据场景结构作出决策的能力。本文研究了涉及胶合引起的稳定的建塔任务，通过引入一个使用物体及关系中心的视觉与策略表达方式的深度强化学习代理来验证该假设。结果表明，这些结构化的表达方式允许代理赢过人类及其他机器学习方法，这表明关系归纳偏置对于解决结构化推理问题及构建更智能、灵活的机器是重要组成部分。

Jun, 2018

任务诱导的表示学习

本研究评估表征学习方法在视觉复杂环境下决策制定中的有效性，并发现任务诱导的表征学习方法可以提高样本效率和学习效率。

Apr, 2022

神经架构归纳偏差对于关系任务的影响

本研究探讨了在深度学习中通过将关系和感觉信息分隔，以及引入归纳偏差来改善系统的推理性能，并提出了基于相似性分数的简单架构 -- Compositional Relational Network (CoRelNet), 增强了模型的鲁棒性，提高了关系计算的分布外泛化能力。

Jun, 2022

基于关系强化学习实现实用的多物体操作

本文介绍了使用基于图形的关系结构从简单的任务中学习并实现复杂的机器人操作任务，使用了强化学习方法并在喂入少量数据的情况下超越现有的最先进方法，同时也实现了零样本泛化。

Dec, 2019

基于模型的强化学习中对象和系统化概括的视角

本文论述在智能代理的建模过程中，对象化有助于先前知识的模块化再使用和组合构建模型。但针对此限制，文章探讨了在连接主义模型中动态绑定特征（对象）的产生需要满足的需求以及相应的归纳偏差。

Jun, 2019

基于物体中心表征的自监督视觉强化学习

该研究提出了使用基于物体的表征作为组成性生成世界模型所学习的模块化和结构化观察空间，以帮助自主代理发现和学习有用的技能，并进一步将这些技能组合起来解决复杂的组合任务。

Nov, 2020

关于深度强化学习中的归纳偏差

本文研究了深度强化学习算法中的归纳偏见及其对算法性能的影响，并通过实验发现了某些领域特定组件的更有效的自适应解决方案可能会提高算法性能。

Jul, 2019

面向通用机器人学习的深度目标中心表示

本文提出了一种方法来解决复杂开放环境下机器人操作的问题，该方法基于先前训练的通用视觉模型作为感知系统的对象先验，并引入了一个基于对象的注意机制来确定相关对象，通过少数轨迹或演示将这些对象纳入学习策略，使用强化学习可以学习多种操作任务。

Aug, 2017

使用物体感知表达式的多物体场景视觉运动控制

本文探索运用物体感知表征学习技术进行机器人任务，自监督学习方法可降低实际世界中收集大量标记数据的成本，该研究展示物体感知表征学习技术在策略学习和物体定位预测方面显著提高了当前技术的效能和表现。

May, 2022

以交互为预训练的地面功能表示学习

借助神经网络建模物体状态，可以实现有效的物体功能信息提取并与传统语义学模型相结合，能够在基于图像的语言学习上取得更好的表现。

Jul, 2022