使用语义模型进行学习和规划

ICLRSep, 2018

Learning and Planning with a Semantic Model

Yi Wu, Yuxin Wu, Aviv Tamar, Stuart Russell, Georgia Gkioxari...

TL;DR本论文提出了一种基于深度强化学习的混合模型与无模型集成的方法 LEAPS，通过对含有内在语义规律但视觉多样性的人造环境的实验表明其比不考虑语义内容的强基线更有效。

Abstract

Building deep reinforcement learning agents that can generalize and adapt to unseen environments remains a fundamental challenge for AI. This paper describes progresses on this challenge in the context of man-made envir

deep reinforcement learning generalization adaption man-made environments semantic regularities

发现论文，激发创造

使用深度继承表示进行视觉语义规划

本文提出了一种基于强化学习和模仿学习的视觉语义计划解决方案，使用后继表示来实现跨任务的泛化，用于预测将动态环境从初始状态转换到目标状态的操作序列，在 THOR 环境中实现了近乎最优的结果。

May, 2017

主动语义目标导航的映射学习

本文提出了一种通过主动学习生成语义地图的框架，在未知环境下实现目标物体导航，通过在未观察区域内的语义类别的不确定性进行决策，实现了对场景中语义优先级的学习，并在 Matterport3D 数据库上验证了改进的导航效果。

Jun, 2021

面向语义分割的视觉活动学习

本文研究了具体化视觉主动学习任务，该任务通过选择性的视野请求注释来探索三维环境，以获取场景理解，我们通过开发一系列智能体来研究具体化视觉主动学习，其中智能体配备语义分割网络，并使用深度强化学习以及奖励函数平衡任务性能和必要注释数据请求，得到了可靠的结果。

Dec, 2020

通过编程组合学习实现分层程序化强化学习

该研究提出了一种基于元策略的方法，使用预先生成的程序数据集来学习程序嵌入空间，并找到解决任务的程序。实验结果表明，该方法可在 Karel 领域产生复杂的行为，并超越现有的方法。

Jan, 2023

先斩后奏：桥接基于模型和基于模型的无模型强化学习，为规划先进的视觉语言导航

本文提出了一种新颖的，提前计划的混合增强学习模型，将模型无关的和模型基于的强化学习相结合，以解决实际的视觉语言导航任务，并且实验结果表明，该方法在真实数据集上表现最佳，还具有更好的可扩展性。

Mar, 2018

GAPLE: 室内环境中机器人物体搜索的通用接近策略学习

探讨一种可学习到的通用行动策略用于室内环境中仅通过视觉输入主动接近感兴趣的物体，提出了一种基于深度和语义分割作为策略学习模块输入的新解决方案 GAPLE，通过实证研究在 House3D 数据集上和真实世界情境中的物理平台上进行验证并提供了深入的定性分析。

Sep, 2018

未知环境下使用信息路径规划的半监督主动学习用于语义分割

使用自适应地图规划的半监督主动学习方法，结合高质量的人工标签和自动提取的伪标签，显著降低人工标注的需求，从而在减少人工标注工作量的同时，达到接近全监督方法的分割性能，超过自监督方法。

Dec, 2023

基于语言条件的语义搜索导向的机器人操作任务策略

我们提出了一种基于语言条件的语义搜索方法，从可用的示范数据集中获取在线搜索策略，在 CALVIN 基准测试中超过了基线性能，并展现了强大的零样本适应能力，对于扩展基于在线搜索策略的任务具有巨大的潜力。

Dec, 2023

虚拟到现实：在视觉语义分割中学习控制

为解决机器人虚拟世界到真实世界的迁移问题，本文提出了一种基于模块化架构、采用语义图像分割作为元表示的深度强化学习方法，实现了 RGB 图像到语义图像段转换。实验结果表明，该架构在避障和目标跟踪任务中表现优异，并在虚拟和真实环境中均明显优于基准方法。

Feb, 2018

语义抽象：从 2D 视觉语言模型实现开放式三维场景理解

本文介绍了一种基于视觉语言模型的语义抽象框架，可以为机器人在未结构化的三维环境中推理，并学会三维空间和几何推理技能，并在两个开放式三维场景理解任务上进行了实验测试。

Jul, 2022