心理模拟的神经基础:动态场景潜在表征的未来预测
该论文提出了一种神经模型,同时基于物理学原理和视觉先验进行推理和预测,通过对粒子的估计预测物理参数,即视觉基础,并在刚体、可变形材料和流体的复杂环境中证明了它的有效性,允许模型在几次观察内推断出物理特性,从而快速适应未见过的场景并进行准确的未来预测。
Apr, 2020
该研究提出了一种基于计算机视觉概念,使用深度神经网络从摄像头观测和专业演示数据中训练世界模型和政策的通用框架,该模型可以预测鸟瞰图空间中动态汽车的未来轨迹,并在城市驾驶环境中联合预测静态场景、动态场景和特定行为。
Jun, 2023
为了预测智能与健壮的复杂动态环境下未来的多个目标路径,该论文提出了基于概率的框架来学习表示语义多模态未来的潜在变量,其中利用动态基于注意力的状态编码器学习编码智能体之间的交互,可被用于车辆轨迹预测。
Nov, 2019
本文从物理场景理解出发,比较了基于直觉物理引擎、基于记忆模型和基于卷积神经网络的场景理解模型,发现基于模拟的模型在人类思维和感知的角度上更胜一筹,并且拥有更好的泛化能力。
May, 2016
通过自主学习的潜在事件编码,我们模拟了层次预测的发展,并提出了一种采用递归神经网络的分层体系结构,能够生成能够压缩感知动作序列的稀疏变化潜在状态。高层网络能预测潜在状态发生变化的情况。我们在仿真机器人操纵器上进行了实验,结果显示这个系统学习到了准确的数据事件结构,能够生成类似于婴儿眼追踪研究中发现的目标预期行为,并且为自主学习压缩层次编码和利用这些编码来生成自适应行为提供了新的方式。
Jun, 2022
本文提出了一种从 2D 视觉观察中学习动态 3D 场景模型的方法,结合神经放射场、时间对比学习和自动编码框架,可以学习到视点不变的 3D 感知场景表示,进而实现包括刚体和流体在内的具有挑战性的操作任务的视觉运动控制和未来预测,并支持摄影机视点外训练分布的目标规定,此外,还对不同系统设计进行了详细的改变研究和学习的表示的定性分析。
Jul, 2021
本文介绍了一种基于视觉交互网络的模型,能够从原始视觉观察数据中学习物理系统的动力学,在复杂的物理环境中支持基于模型的决策制定和规划。该模型由基于卷积神经网络的感知前端和基于交互网络的动力学预测器组成,支持从少量视频帧生成准确的未来轨迹预测。
Jun, 2017