通用神经网络能从儿童的视觉经验中学到什么?
该文介绍了一种基于神经网络的动态视觉推理问题的更通用方法,通过学习物体中心表示、自我关注和自监督动力学学习,以实现三个不同领域的最先进表现,在每种情况下都优于针对任务特定定制的专用模块化方法。
Dec, 2020
本文提出了一种基于先前知识建模、示例学习和视频上下文学习的轻度半监督目标检测的计算模型,通过与现实实例的交互,从未标记的视频中检测并识别出更多的实例,进一步提高识别能力。
Nov, 2014
通过自监督学习方法,针对各种来源、无需数据预处理的数十亿张随机图片进行训练,生成可以识别物体、风格、地理位置等信息的模型,并对其公平性、偏差等进行了多角度验证,证明其表现优异、不会对数据进行歧视和危害。
Feb, 2022
通过比较 146 个孩子和成年人以及深度神经网络的核心目标识别表现,发现了出人意料的鲁棒性,并且提出了与站在人类视角不同的、更需要数据的策略。
May, 2022
本研究使用玩具箱数据集和计算机视觉框架进行自我监督对比学习实验,发现通过学习信号,将单个物体的不同视角赋予相似的表示有助于视觉学习的稳健性,这种性能的提高对于多种图像分类任务来说是可持续的。
May, 2023
基于学习的方法,使用生成式查询网络(GQNs)与新颖的注意力机制,无需建立显式的点云或体素地图,实现对 Minecraft 中的 3D 场景进行视觉定位任务。
Jul, 2018
本文探讨了基于预测未来帧的 CNN-LSTM-deCNN 框架的深度神经网络开发的内部模型,该模型学习了高层次对象特征的丰富内部表示。可以广泛泛化,是一种有效的无监督学习方法。
Nov, 2015
通过实验证明了在多模态环境中进行语言学习可以提高预测准确率,该研究使用了预训练的 BERT 嵌入以及不同语言和模型进行了测试,并得出了这个认识与身处环境相应认知理论相对应的结论。
May, 2018