In real life, the decoration of 3D indoor scenes through designing furniture
layout provides a rich experience for people. In this paper, we explore the
furniture layout task as a markov decision process (MDP) in
本研究提出了一种将高层次 AI 规划与强化学习相结合的综合方法,通过建立 AI 规划问题的状态转换模型与马尔科夫决策过程的抽象状态转换系统之间的对应关系,使用内在奖励学习定义层次强化学习中的操作,以增强其一致性与从容。实验结果表明,与现有方法相比,该方法在 MiniGrid 和 N 房间环境中表现更好。