- 从文本描述中生成三维场景的人类动作
通过将任务分解为两个可管理的子问题:目标对象的语言准确性和以目标对象为中心的运动生成,本文提出了一种新的方法来生成给定人 - 场景交互文本描述的 3D 室内场景中的人体动作,实验表明我们的方法在运动质量方面优于基线并验证了我们的设计选择。
- EchoScene: 基于场景图信息回波的室内场景生成
利用 EchoScene,我们提出了一种交互式和可控的生成模型,它基于场景图生成 3D 室内场景。EchoScene 利用双分支扩散模型,动态适应场景图。通过信息回响方案,在形状和布局分支上实现了共享信息交换单元来提供对全局约束的可控和一致 - 人类动作生成的背景及目的
我们提出了一种新的方法,基于神经离散表示学习,用于生成人类运动以填充 3D 室内场景,并利用场景、上下文信息等多种组合的调控信号进行控制,解决了现有方法的局限性,使得模型在质量和多样性上优于现有的特定上下文信息的方法。
- QueSTMaps:可查询的二维场景语义拓扑地图
通过楼层平面图提取,我们引入了一个两步流程,首先使用一种新颖的多通道占用表示提取室内场景的拓扑图,然后使用自注意力转换器基于对象生成每个房间实例的 CLIP 对齐特征和语义标签。我们在房间分割和分类上的表现超过了当前最先进技术,我们的定性分 - AnyHome:基于开放词汇的结构化和纹理化的 3D 家居生成
通过使用特定的模板和层次化的结构化表示,AnyHome 框架能够将自由形式的文本描述翻译成具备精细空间结构和纹理的三维室内场景。
- 在 3D 室内场景中合成多样的人体动作
提出了一种基于强化学习的方法来处理 3D 室内场景中虚拟人类与环境以及物体的交互,包括生成运动模型、创新的碰撞回避奖励函数、基于标记体和半径场的交互感知奖励函数以及训练策略等多个方面,实验结果表明,该方法在运动的自然性和多样性方面都优于现有 - NeRFVS: 基于几何支架的自由视点综合的神经辐射场
NeRFVS 利用全貌因子指导 NeRF 的学习,并提出两个损失函数解决几何和颜色模糊性,经实验证明在室内场景的自由导航中,优于现有的视角合成方法,实现了高保真度的自由导航结果。
- 三维室内场景语言引导的语义风格转移
本文介绍了一种语言引导的 3D 室内场景语义风格转移的方法,基于多层感知机,视觉语言模型,采用渲染和修正的方式实现创新,通过 ScanNet 数据集测试表明,语义信息的引入显著提高了风格转移的品质和用户评分。
- NeuRIS: 使用法线先验的神经重建室内场景
提出了一种名为 NeuRIS 的新方法,该方法在神经成像框架中整合室内场景的估计法线作为优先重建大型无纹理形状,以及使异形形状具有细节;只有经过验证为忠实的优先权才会用于 3D 重建,实验证明,该方法在重建质量方面显著优于现有的方法。
- 将人类置于场景中:学习 3D 室内环境中的可支配性
本论文探讨了在三维室内场景中预测人类动作所需的可负担性建模技术,并通过引入语义和几何结构来创建大规模数据集合并使用三维姿态合成器预测出语义合理的人体姿态。最终的可负担性预测方法能够持续胜过现有的最新方法。
- GRAINS: 室内场景生成递归自编码器
本研究通过使用基于层次结构的编码器(支持,周围和共存关系),实现了用于室内 3D 场景生成的递归神经网络,结合一种变分自编码器(VAE),用于场景对象组合和场景生成。研究表明,所提方法能够高效地生成大量和多样化的 3D 室内场景,并在与现有 - 室内场景实时渐进式 3D 语义分割
本文提出了一种高效而健壮的技术,实现了 3D 室内场景的即时密集语义分割和重建,该方法基于高效的超体素聚类方法和来自结构和对象线索的高阶约束的条件随机场,无需预先计算即可进行渐进式密集语义分割。通过对 SceneNN 和 ScanNet 数