世界发现模型

Feb, 2019

World Discovery Models

Mohammad Gheshlaghi Azar, Bilal Piot, Bernardo Avila Pires, Jean-Bastian Grill, Florent Altché...

TL;DR本文介绍了一种名为 NDIGO 的神经差分信息增益优化自我监督发现模型，旨在利用现代人工智能技术建立一个能够自主发现其世界的代理工具。通过对一些受控的二维导航任务的实验，发现 NDIGO 在学习表示质量方面的表现优于现有的信息寻求方法，尤其是在存在白色或结构噪声的情况下，其他信息寻找方法还停留在噪声中，并没有真正发现其世界。

Abstract

As humans we are driven by a strong desire for seeking novelty in our world. Also upon observing a novel pattern we are capable of refining our understanding of the world based on the new information---humans can discover their world. The outstanding ability of the human mind for discovery has led to many breakthroughs in science, art and technology. Here we

发现论文，激发创造

进化文化 vs 局部最小值

我们提出了一种理论，该理论将深度体系结构中的学习困难与文化和语言联系起来，并基于实验观察结果，指出了人类文化和思想进化对优化困难的关键作用。

Mar, 2012

通过模仿学习信息聚集

本篇论文研究的是一个应用于移动机器人自主探索和检查的问题，即在燃料预算有限的情况下最大化从世界中获取的信息量的问题。作者提出了一种新颖的数据驱动的模仿学习框架，并通过EXPLORE算法来训练一个策略以模仿一个有完整信息并计算非简约解来最大化获取信息的先知，验证了这一方法在不同对象分布上的适应能力。

Nov, 2016

自监督预测驱动下的好奇心驱动探索

通过在自监督逆向动力学模型学习的视觉特征空间中预测行动结果的错误来形成好奇心作为内在奖励信号，提高自主智能体在缺乏外部奖励刺激的情况下探索环境和学习技能的能力，具有在不同领域中推广的潜力。

May, 2017

深度進化神經反饋與離散世界模型

通过遗传算法，同一物体的不同部分可以被联合训练，得到与分开训练相媲美的性能，该研究进一步证明了深度神经进化在复杂异构体系结构下的有效性。

Apr, 2019

利用进步好奇心进行主动世界模型学习

本文研究如何设计这样的好奇心驱动的主动世界模型学习系统，提出一种由可扩展和有效的学习进步基础好奇心信号驱动的 AWML 系统，并表明相对于基线控制器，该控制器的性能得到显着提高。

Jul, 2020

自动科学发现：从方程发现到自主发现系统

综述了科学自动化发现的各种方法，从方程式发现和符号回归到自主发现系统和代理人等，着重讨论了深度神经网络在这一领域中的各种角色和作用，并探讨了达到最大水平——第五级的自主性所需的条件，以实现无需人工干涉的科学发现。

May, 2023

利用人工智能与人工智能了解人类加速科学

该研究表明，将人类专业知识的分布纳入考虑，并以此训练无监督的人工智能模型，能够显著提高 AI 对未来发现的预测能力，特别是在相关文献稀缺的情况下，这些模型成功预测出人类预测和可能做出预测的科学家，为科学进步开创新的前沿。

Jun, 2023

开放世界中元特性驱动下的量子学习与基本认知

这篇论文提出了一个开放世界模型和元特征系统，专注于在新旧世界之间的客观特征分布差异的基本识别，并通过元特征的牵引力实现了对新旧世界中学习能力的量子隧穿效应。该模型在学习新知识方面表现出色（以行人重识别数据集为例），最高可达96.71％的准确度，并获得了类似于人类的探索新知识的能力。

Nov, 2023

DISCOVERYWORLD：开发和评估自动科学发现代理的虚拟环境

开发和评估AI代理的端到端科学推理能力具有挑战性，本文介绍了DISCOVERYWORLD，这是第一个用于开发和评估代理执行完整的新颖科学发现循环能力的虚拟环境，通过包含不同挑战任务，覆盖放射性同位素约会、火箭科学和蛋白质组学等多个主题，鼓励培养一般的发现技能而非特定任务的解决方案，提供了自动度量指标来评估性能，发现在DISCOVERYWORLD任务中，之前在其他环境中表现良好的强基线代理却遇到了困难，这表明DISCOVERYWORLD捕捉到了部分新颖的发现挑战，并可能加速代理的科学发现能力的发展和评估。

Jun, 2024

通过世界动态建模增强智能体学习

本研究解决了现有大型语言模型在理解环境动态方面的知识缺口。我们提出了DiVE框架，能够从少量示范中发现世界动态并验证其正确性，从而发展出适应当前情境的动态。研究表明，借助DiVE的智能体在决策上表现更优，达到了与人类玩家相当的奖励水平。

Jul, 2024