本文提出了一种基于强化学习和模仿学习的视觉语义计划解决方案,使用后继表示来实现跨任务的泛化,用于预测将动态环境从初始状态转换到目标状态的操作序列,在 THOR 环境中实现了近乎最优的结果。
May, 2017
本文提出了一种通过主动学习生成语义地图的框架,在未知环境下实现目标物体导航,通过在未观察区域内的语义类别的不确定性进行决策,实现了对场景中语义优先级的学习,并在 Matterport3D 数据库上验证了改进的导航效果。
Jun, 2021
本文研究了具体化视觉主动学习任务,该任务通过选择性的视野请求注释来探索三维环境,以获取场景理解,我们通过开发一系列智能体来研究具体化视觉主动学习,其中智能体配备语义分割网络,并使用深度强化学习以及奖励函数平衡任务性能和必要注释数据请求,得到了可靠的结果。
Dec, 2020
该研究提出了一种基于元策略的方法,使用预先生成的程序数据集来学习程序嵌入空间,并找到解决任务的程序。实验结果表明,该方法可在 Karel 领域产生复杂的行为,并超越现有的方法。
Jan, 2023
本文提出了一种新颖的,提前计划的混合增强学习模型,将模型无关的和模型基于的强化学习相结合,以解决实际的视觉语言导航任务,并且实验结果表明,该方法在真实数据集上表现最佳,还具有更好的可扩展性。
Mar, 2018
探讨一种可学习到的通用行动策略用于室内环境中仅通过视觉输入主动接近感兴趣的物体,提出了一种基于深度和语义分割作为策略学习模块输入的新解决方案 GAPLE,通过实证研究在 House3D 数据集上和真实世界情境中的物理平台上进行验证并提供了深入的定性分析。
Sep, 2018
使用自适应地图规划的半监督主动学习方法,结合高质量的人工标签和自动提取的伪标签,显著降低人工标注的需求,从而在减少人工标注工作量的同时,达到接近全监督方法的分割性能,超过自监督方法。
Dec, 2023
我们提出了一种基于语言条件的语义搜索方法,从可用的示范数据集中获取在线搜索策略,在 CALVIN 基准测试中超过了基线性能,并展现了强大的零样本适应能力,对于扩展基于在线搜索策略的任务具有巨大的潜力。
为解决机器人虚拟世界到真实世界的迁移问题,本文提出了一种基于模块化架构、采用语义图像分割作为元表示的深度强化学习方法,实现了 RGB 图像到语义图像段转换。实验结果表明,该架构在避障和目标跟踪任务中表现优异,并在虚拟和真实环境中均明显优于基准方法。
Feb, 2018
本文介绍了一种基于视觉语言模型的语义抽象框架,可以为机器人在未结构化的三维环境中推理,并学会三维空间和几何推理技能,并在两个开放式三维场景理解任务上进行了实验测试。
Jul, 2022