虚拟室内场景中家具布局的分层强化学习

Oct, 2022

虚拟室内场景中家具布局的分层强化学习

Hierarchical Reinforcement Learning for Furniture Layout in Virtual Indoor Scenes

Xinhan Di, Pengqian Yu

TL;DR本文使用层次化强化学习 (HRL) 将家具布局任务作为马尔科夫决策过程 (MDP) 完成，以实现在室内场景的虚拟现实中产生适当的二家具布局，最终结果表明该模型可以产生比现有模型更高质量的布局。

Abstract

In real life, the decoration of 3D indoor scenes through designing furniture layout provides a rich experience for people. In this paper, we explore the furniture layout task as a markov decision process (MDP) in

furniture layout markov decision process hierarchical reinforcement learning virtual reality interior design

发现论文，激发创造

基于深度强化学习策略的分层控制器合成

我们提出了一种新颖的方法来解决以马尔可夫决策过程（MDP）建模的环境的控制器设计问题。具体而言，我们考虑了一个层次 MDP，该图的每个顶点由一个名为 “房间” 的 MDP 填充。我们首先应用深度强化学习（DRL）来获取每个房间的低级策略，适用于未知结构的大型房间。然后，我们应用反应合成来获取一个高级规划器，该规划器选择在每个房间中执行哪个低级别策略。在综合规划器中的核心挑战是对房间建模的需求。我们通过开发一种 DRL 过程来训练简洁的 “潜在” 策略以及对其性能的 PAC 保证来解决这一挑战。与以前的方法不同，我们的方法避开了模型蒸馏步骤。我们的方法解决了 DRL 中稀疏奖励的问题，并实现了低级策略的可重用性。我们通过一个案例研究展示了可行性，该研究涉及在移动障碍物中的智能体导航。

Feb, 2024

FurnitureBench：面向复杂长期操作的可复制实现的真实世界基准测试

该研究提出面向复杂长程行为的真实世界家具组装任务，并提出 FurnitureBench 家具组装基准测试，供研究人员测试和比较不同算法的性能表现，基于该基准测试验证了在线和离线强化学习、模仿学习算法的性能，进一步提出未来的研究方向。

May, 2023

从物体点云中学习家具装配

本文介绍了一种基于学习的方法，使用模拟环境实现家具组装规划，无需连接标签，仅依靠原始点云图像来训练神经网络以成功组装不同类型的家具。

Sep, 2022

数据效率的分层强化学习

本文研究如何构建通用且高效的层次强化学习算法，其中较低层的控制器通过自动学习和提出的目标来实现上级控制器的监督，并使用脱离策略的经验来提高效率。我们称此算法为 HIRO，并在模拟机器人上的实验中表现出高性能和高样本效率。

May, 2018

学习坐姿：通过分层控制合成人与椅子的交互

通过深度强化学习基于物理的角色动画的最新进展，本文提出了一种基于层次化强化学习的框架，通过一系列子任务控制器的集合进行训练以模仿简单的可重复使用的动作来完成交互任务的人物动作，实验结果显示本方法优于非层次化和层次化基线的方法，并且可以应用于给定图像输入的动态预测。

Aug, 2019

基于因果推断的强化学习层次化结构发现

本论文提出了 CDHRL 框架，通过因果驱动探索而非随机驱动探索来构建高质量的分层结构，以提高分层强化学习的探索效率。实验表明，在 2D-Minecraft 和 Eden 两种复杂环境中，CDHRL 显著提高了探索效率。

Oct, 2022

生成多样化的室内家具布置

本研究提出了一种使用生成对抗网络和质量多样性算法生成室内家具布置方案的方法，该方法可针对特定的多样性主题生成不同价格和数量家具件数的排列组合。

Jun, 2022

具有 AI 规划模型的分层强化学习

本研究提出了一种将高层次 AI 规划与强化学习相结合的综合方法，通过建立 AI 规划问题的状态转换模型与马尔科夫决策过程的抽象状态转换系统之间的对应关系，使用内在奖励学习定义层次强化学习中的操作，以增强其一致性与从容。实验结果表明，与现有方法相比，该方法在 MiniGrid 和 N 房间环境中表现更好。

Mar, 2022

带有个性化偏好的室内场景结构规划

本文提出了一种支持专业室内设计师制作产业室内装饰解决方案并满足业主个性化偏好的辅助模型，其由抽象图提取、条件图生成和条件场景实例化组成，同时提供一个包含来自专业设计师的 11000 个实例设计的室内布局数据集，实验结果表明该模型相对于最先进的方法的效果。

Aug, 2020

无模型分层强化学习中的表示学习

本文提出了一种基于最近的经验的无模型子目标发现方法和内在动机学习机制相结合的层次强化学习方法，可以应用于大规模的问题，实现了对环境模型的无需获取，用于解决强化学习面临的巨大状态空间和稀疏奖励反馈的问题。

Oct, 2018