通用神经网络能从儿童的视觉经验中学到什么？

May, 2023

通用神经网络能从儿童的视觉经验中学到什么？

What can generic neural networks learn from a child's visual experience?

A. Emin Orhan, Brenden M. Lake

TL;DR通过训练神经网络从一个孩子的视觉经验中学习，我们研究了基于本能的约束和基于经验的影响对于孩子内部模型的形成的影响，并发现在没有强烈的归纳偏见的情况下，孩子的代表性样本足以从其中获得广泛有用的高级视觉表示。

Abstract

Young children develop sophisticated internal models of the world based on their egocentric visual experience. How much of this is driven by innate constraints and how much is driven by their experience? To investigate these questions, we train state-of-the-art →

neural networks visual experience self-supervised learning embedding models generative models

发现论文，激发创造

儿童视角下的自我监督学习视频表征

从儿童的视觉经验中，可以通过高度通用的学习算法来学习他们对世界的强大内部模型，这包括长期记录的视频数据集和自我监管学习算法，而无需强烈的归纳偏差。

Feb, 2024

孩子眼中的自监督学习

本文利用现代自监督深度学习方法和儿童的视角记录的最新纵向数据集，通过对自然视频的学习，实现了从发展逼真的自然视频中获得强有力、高级别视觉表示的目标。

Jul, 2020

通过学习目标嵌入进行注意力，实现复杂的视觉推理

该文介绍了一种基于神经网络的动态视觉推理问题的更通用方法，通过学习物体中心表示、自我关注和自监督动力学学习，以实现三个不同领域的最先进表现，在每种情况下都优于针对任务特定定制的专用模块化方法。

Dec, 2020

计算机婴儿学习

本文提出了一种基于先前知识建模、示例学习和视频上下文学习的轻度半监督目标检测的计算模型，通过与现实实例的交互，从未标记的视频中检测并识别出更多的实例，进一步提高识别能力。

Nov, 2014

在无监督未筛选图像上进行预训练使视觉模型更健壮和公正

通过自监督学习方法，针对各种来源、无需数据预处理的数十亿张随机图片进行训练，生成可以识别物体、风格、地理位置等信息的模型，并对其公平性、偏差等进行了多角度验证，证明其表现优异、不会对数据进行歧视和危害。

Feb, 2022

物体识别健壮性的发展轨迹：儿童类似于小成年人，但不像大深度神经网络

通过比较 146 个孩子和成年人以及深度神经网络的核心目标识别表现，发现了出人意料的鲁棒性，并且提出了与站在人类视角不同的、更需要数据的策略。

May, 2022

自我监督视觉学习中基于计算的接受者目视着物游戏的解释

本研究使用玩具箱数据集和计算机视觉框架进行自我监督对比学习实验，发现通过学习信号，将单个物体的不同视角赋予相似的表示有助于视觉学习的稳健性，这种性能的提高对于多种图像分类任务来说是可持续的。

May, 2023

使用隐式映射的视觉三维定位学习模型

基于学习的方法，使用生成式查询网络（GQNs）与新颖的注意力机制，无需建立显式的点云或体素地图，实现对 Minecraft 中的 3D 场景进行视觉定位任务。

Jul, 2018

使用预测生成网络进行视觉结构的无监督学习

本文探讨了基于预测未来帧的 CNN-LSTM-deCNN 框架的深度神经网络开发的内部模型，该模型学习了高层次对象特征的丰富内部表示。可以广泛泛化，是一种有效的无监督学习方法。

Nov, 2015

像婴儿一样：视觉背景下的神经语言习得

通过实验证明了在多模态环境中进行语言学习可以提高预测准确率，该研究使用了预训练的 BERT 嵌入以及不同语言和模型进行了测试，并得出了这个认识与身处环境相应认知理论相对应的结论。

May, 2018