目标导航探索的复杂性

NIPSNov, 2018

On the Complexity of Exploration in Goal-Driven Navigation

Maruan Al-Shedivat, Lisa Lee, Ruslan Salakhutdinov, Eric Xing

TL;DR通过构建依赖图和分析随机漫步的击中时间，我们设计出了一类逃脱房间环境，评估了不同种类的奖励方法和分层策略对于智能体探索能力的影响，并表明超过某个复杂度的环境需要采用分层方法。

Abstract

Building agents that can explore their environments intelligently is a challenging open problem. In this paper, we make a step towards understanding how a hierarchical design of the agent's policy can affect its exploration capabilities. First, we design EscapeRoom environments, where the agent must figure out how to navigate to the exit by accomplishing a n

agent exploration capabilities hierarchical agent policy procedurally generated escape rooms environment complexity measurement hierarchical approaches

发现论文，激发创造

基于贝叶斯优化的子目标探索

本文提出了一种基于代价感知的贝叶斯优化方法，旨在通过动态子目标的一系列探索策略来克服稀疏奖励、高昂交互和噪声等挑战，实现在未知分布环境下的政策学习。在实验评估中，平均而言，所提出的算法在问题领域上的表现优于 MAML 元学习算法 19％，超参数调整方法 Hyperband 23％，BO 技术 EI 和 LCB 分别为 24％和 22％。

Oct, 2019

为高效探索确定目标取向轨迹

本研究查明了纯随机漫步无法在大多数环境中成功扩展探索领域，并提出将单个随机操作选择替换为随机目标选择，该方法与任何基于好奇心的探索和脱机强化学习代理兼容，并生成比单个随机操作更长且更安全的轨迹。

Jul, 2018

分层策略学习对目标空间设计敏感

通过对理想目标空间的研究，系统地分析的各种修改对分层模型学习的影响，结果表明旋转目标空间和噪声对学习没有影响，而具有额外的不必要因素显著地损害了分层模型的学习效果。

May, 2019

学习在复杂环境中导航

利用增强学习问题和多模态感应输入的辅助深度预测和循环闭环分类任务，可以学习从复杂 3D 迷宫中进行导航并接近人类级别表现

Nov, 2016

自动化可达性测试：在复杂的 3D 游戏环境中探索

通过在游戏的导航网格上使用基于 Go-Explore 算法的简单启发式算法，以及并行处理器，实现了在测试游戏中发现难以察觉的到达性缺陷和全面探索复杂环境的目的，避免了需要人工演示或了解游戏动态的需求。Go-Explore 在覆盖导航网格和发现地图上的独特位置方面比包括驱动好奇心的强化学习在内的更复杂基线表现更好。

Sep, 2022

学习导航探索策略

本研究提出了使用基于学习的方法，实现任务无关的探索性导航的想法，在对比传统的使用几何技术和通用学习技术的情况下，所采用的包括了空间记忆的策略可以更好地探索新的 3D 环境，并将其用于下游任务。

Mar, 2019

通过修剪原型目标扩展目标导向探索的规模

本研究基于强化学习，通过在人工设计产生的广泛目标空间中寻找可控、可达、新颖和相关目标的自主发现过程，弥补探索广域领域中新奇性和涵盖性行为不足的问题，并在三种具有挑战性的环境中证明了目标导向的探索的有效性。

Feb, 2023

DD-PPO：利用 25 亿帧学习接近完美的目标点导航

介绍分布式强化学习的 Decentralized Distributed Proximal Policy Optimization (DD-PPO) 方法，用于在资源密集型模拟环境中训练虚拟机器人进行导航，实现了近乎线性的扩展，通过训练并转移场景理解和导航策略，方法实现了身体智能上的图像预训练加特定任务微调。

Nov, 2019

学习去耦合目标空间的好奇心驱动探索

本文介绍了如何使用内在动机和深度学习算法来有效生成目标空间，提出了使用解耦目标空间可以更好地进行探索，同时利用模块化学习进度驱动求知型探索，同时发现了环境的独立可控特征。

Jul, 2018

自主探索与多目标随机最短路径的近最优算法

该研究重新审视了 Lim＆Auer（2012）提出的增量自主探索问题，提出了一种新算法，并证明了该算法在控制状态数多项式增长时是几乎极小化的。

May, 2022