因果世界模型的内在激励学习

Aug, 2022

Intrinsically Motivated Learning of Causal World Models

Louis Annabi

TL;DR研究探索通过推断环境因果结构以收集相关干预数据为手段，建立捕捉传感器运动交互背后真实物理机制的世界模型对于提高深度学习、强化学习、迁移学习和泛化能力至关重要。

Abstract

Despite the recent progress in deep learning and reinforcement learning, transfer and generalization of skills learned on specific tasks i

deep learning reinforcement learning transfer learning generalization causal structure

发现论文，激发创造

强大的代理学习因果世界模型

任何能够满足大量分布变化下后悔边界的代理必须学习数据生成过程的近似因果模型，对于最优代理而言，该模型将趋近于真实的因果模型。这一结果对于包括迁移学习和因果推断在内的几个研究领域具有重要影响。

Feb, 2024

基於内在動機的自我意識代理學習玩耍

使用神经网络的好奇心驱动内在动机以及采用自我监督的方法，在简单而生态自然的模拟环境中，实现自主环境探索，获取对环境的理解，从而创造一系列复杂的行为，并提高了对象动态预测、检测、定位和识别任务的性能。

Feb, 2018

利用人类引导的因果知识实现更一般化的机器人任务规划

通过人类引导的因果知识的使用，作者在语言接口和机器人上开发和测试了一种方法，可以使机器人在新环境中获得泛化解决方案。

Oct, 2021

我们是否已经建造出像人一样思考的机器？

通过一系列的实验，我们评估了当前基于视觉的大型语言模型在直觉物理、因果推理和直观心理领域的表现。我们的研究结果表明，尽管这些模型在处理和解释视觉数据方面表现出显著的能力，但在这些领域仍然不如人类。这些模型对物理定律和因果关系有基本的理解，但缺乏更深入的洞察力 - 人类认知的一个关键方面。此外，在需要直觉心理理论的任务中，这些模型完全失败。我们的结果强调了将更强大的理解因果关系、物理动力学和社会认知机制整合到现代基于视觉的语言模型中的必要性，并指出了认知启发式评估标准的重要性。

Nov, 2023

基于人工智能因果模型的推断物理定律

我们提出了一种因果学习模型，通过因果推断和干预研究物理现象的因果关系，并加强（或削弱）对潜在物理过程模型的信心。

Sep, 2023

因果模型的可迁移性结构映射

本文介绍了一种基于对象导向表现形式的迁移学习框架，该框架利用人类学习因果模型并将其用于环境的变量之间的迁移。作者将连续优化的结构学习技术应用于对象之间的因果关系的显式学习中，并通过基于因果知识的对象分类将其迁移到目标领域。最后，在强化学习中，作者结合了因果模型和无模型方法，实现对格子世界环境中的对象表现的优化。

Jul, 2020

从统计学习到因果学习

该研究阐述了建立和理解人工智能系统的基本思想：从符号方法到统计学习，再到基于因果关系概念的干预模型，其中一些机器学习和人工智能的难题内在地与因果关系有关，而进展可能需要我们加深对如何从数据中建模和推断因果关系的理解。

Apr, 2022

基于理论的因果转移：融合实例级归纳与抽象级结构学习

采用因果理论的角度来解决迁移学习的问题，在 OpenLock 环境中实现了基于模型和 Bayesian 结构的计划者与模型学习方案，与强化学习相比，该模型表现出更好的迁移表现和类似于人类学习者的表现趋势。

Nov, 2019

通用智能需要重新思考探索

通过将探索驱动的学习概念性地统一监督学习和强化学习之间的探索驱动学习，我们提出了广义探索问题，以突出不同学习设置之间的关键相似之处和开放研究挑战，广义探索是用于维护开放式学习过程的必要目标。

Nov, 2022

因果革命中七个火花对机器学习的理论阻碍

为了实现强人工智能，机器学习系统需要现有因果推断任务所使用的现实模型等形式来进行指导，以克服当前系统以统计或无模型方式运行时的理论性局限和性能障碍。该论文总结了现有系统无法完成的七个任务，并说明了现实模型对机器学习系统的必要性。

Jan, 2018