- ICLR深度强化学习大批量模拟
该论文在复杂的 3D 环境中,通过设计以 “batch simulation” 为原则的 3D 渲染器和模拟器来加速基于深度强化学习的训练,使用单个 GPU 每秒获得超过 19,000 帧的经验,并在单个 8-GPU 机器上每秒获得最高达 - MultiON: 使用多对象导航基准测试语义地图记忆
本文探讨了在三维环境中进行导航任务的挑战以及地图类记忆对导航任务的影响,提出了新的 MultiON 任务,通过一系列实验考察了不同复杂度任务下代理模型的表现,发现简单语义地图代理的表现相对更优,但神经图像特征地图代理和 oracle 地图代 - ECCV有效勘测和导航的占有率预测
提出了一种基于占用状态预测的导航方法,该方法利用了车辆自身的 RGB-D 观察结果来推断不可见区域的占用状态,进而加快了车辆的空间认知,提升了在 3D 环境中的探索和导航效率。在 Gibson 和 Matterport3D 数据集上,该方法 - ECCV学习使用不确定拓扑地图进行规划
本文采用一种数据驱动的策略和基于图像的规划,应用于 3D 环境中的导航系统,通过机器学习方法实现了图像哈希表上的最短路径规划,比传统符号算法更优秀。
- ICLR使用主动神经 SLAM 学习探索
论文介绍了一种名为 Active Neural SLAM 的模块化和分层方法来学习探索 3D 环境的策略,并在真实的 3D 环境中进行实验,结果表明该方法比过去的学习和几何方法更有效。
- KDD使用协作多智能体强化学习在触摸界面上学习 3D 导航协议
利用强化学习算法,通过人机协作,自动学习一种新的交互协议,从而将二维触控输入映射到虚拟环境下的三维操作,防止用户学习经典的固定交互协议。此外,该方法采用变分自编码器 (VAE) 基于状态表示学习来投影手势轨迹到潜在空间中。
- CVPR虚拟地面真实性和 3D 兴趣点预选,以提高 2D 检测器的可重复性评估
通过虚拟三维场景辅助测试,本文探讨了如何改进二维图像处理中的特征检测器,并将其应用于三维环境中。实验结果表明,虚拟环境可以提高特征检测器的性能,消除了大量误报情况,并通过 ROC 曲线测量指标展示了二维和三维性能的权衡。
- 学习导航探索策略
本研究提出了使用基于学习的方法,实现任务无关的探索性导航的想法,在对比传统的使用几何技术和通用学习技术的情况下,所采用的包括了空间记忆的策略可以更好地探索新的 3D 环境,并将其用于下游任务。
- 机器人、虚拟现实和增强现实的实时定位和建图技术原理概览
该论文描述了如何支持应用专家在选择和配置适当的算法和适当的硬件编译路径,在 SLAM(同时定位和制图)应用中实现算法交付的工具和方法,包括系统定量评估 SLAM 算法的工具和方法,自动化的机器学习指导算法和实现设计空间的探索,以及用于优化异 - 神经地图:深度强化学习的结构化记忆
本研究开发了一种记忆系统,名为神经图,使用空间结构的 2D 记忆图像来学习存储环境的任意信息,能够在长时间间隔内超越以前的 DRL 记忆并且能够推广到在训练期间未见过的环境。
- 使用 SLAM 增强的深度强化学习玩《毁灭战士》游戏
该研究使用前人认为人类认知中的语义概念和抽象能力,将对象和结构元素添加到图像输入,改进了深度 Q 学习网络(DQN)代理模型的策略学习框架,并在 3D 第一人称射击游戏 “毁灭战士” 中表现出更好和更有效的策略。
- 使用深度强化学习玩射击游戏
本研究提出了一种融合游戏特征信息的深度强化学习神经网络模型,其能够在处理 3D FPS 游戏的部分可观察状态下显著提高训练效率和性能。