- 建模和渲染散射和发光介质的体素基元
基于基元的体积表示可以用于建模散射和发光介质,并具有相对高效的渲染。我们提出了基于混合核心体积基元的散射和发光介质建模方法,并提供了一些优化以实现高性能和易用性。
- GVGEN: 基于体积表示的文本到 3D 生成
该论文介绍了一种名为 GVGEN 的新型扩散基础框架,用于通过文本输入高效生成 3D 高斯表示。它通过结构化体积表示和从粗到细的生成流程提供了优越的性能,同时保持了快速生成速度。
- 头戴式耳机:部分遮挡的多模感知人类情感数据集
我们提出了一个新的多模态数据库来帮助推进沉浸技术的发展,该数据库提供了符合道德规范并且多样化的体积数据,可以支持面部表情识别等扩展现实算法的评估和性能测试。
- PointVoxel: 多视角多模态 3D 人体姿态估计的简单有效流程
提出了一种名为 PointVoxel 的流程,利用多视图 RGB 和 pointcloud 输入融合来获取 3D 人体姿势,并通过合成数据集生成器和无监督域自适应策略来克服在困难场景中标注 3D 人体姿势标签的挑战,展现了有希望的结果。
- VOODOO 3D:一次性 3D 头像重现的体积面部解耦
基于三维感知头部复原方法、神经解缠结框架和立体表达,我们提出了一种实时的、高保真度和视角一致的 3D 头部复原方法,特别适用于基于全息显示的三维电话会议系统。
- 自动解码潜在的三维扩散模型
本文提出了一种新颖的生成静态和关节 3D 资产的方法,其中核心是一个 3D 自解码器框架,将目标数据集中学习到的属性嵌入潜在空间,然后通过解码来渲染具有一致性的外观和几何体积表示;在不需要摄像头信息的情况下,通过学习来进行更加高效的训练,实 - LaTeRF: 标签和文本驱动的物体辐射场
本研究提出了 LaTeRF 方法,通过引入 “对象性” 概率,扩展 NeRF 公式,结合自然语言描述、点标签等信息从场景中提取出感兴趣的物体,并结合预训练的 CLIP 模型和可微分对象渲染器来修复物体的遮挡部分。实验结果表明该方法在合成和真 - ICCV使用体积采样进行拓扑一致的多视角人脸推断
该论文提出了一种名为 ToFu 的几何推理框架,它使用一种体积表示法来生成面部网格,可以跨面部身份和表情产生具有拓扑一致性的网格。该方法通过考虑面部几何学特征,采用从粗到细的神经网络结构来实现稠密准确的面部网格预测,并在 pore-leve - 快速明确的神经视图合成
本文研究了从稀疏源观测中合成新视角的问题,提出了一种简单而有效的方法,通过将观测编码到体积表示中进行摊销渲染,并通过自我监督信号实现了对 3D 几何的有效学习。
- 野外自监督网格预测
该论文提出了一种从单张图像中推断物体的 3D 形状和姿态的学习方法,利用无定型图像集的分割输出进行监督,并采用体素表示和网格化表示相结合的方式进行形状 - 姿态分解和实例重建。
- 任务驱动的知觉和操作:未知物体的约束放置
该论文提出了一种使用简单容积表示法进行机器人夹取和约束放置的算法框架,并通过真实物理实验展示了该方法的成功率和更快的执行时间。
- CVPR通过扭曲三维特征使人形象重现
本研究基于深度学习的体积表示方法,提出利用人体图片,通过几何变形的方式隐式学习稠密特征体积,并通过卷积解码器将特征体积映射回 RGB 空间,实现了人体图像的任意变形,取得了着装识别和人像表情生成方面的最新研究成果。
- 一种基于空间哈希的实时场景重建的高效体网格表示
本文提出了一种创新的框架,采用体积表示法对网格进行紧缩、更新和细化,同时采用哈希方法实现 O (1) 的访问,引入 Hamming 距离方法进一步改善三角形一致性,同时使用基于锁和无锁操作实现 GPU 并行计算,实验证明该方法在在线重建过程 - 三维人体姿态估计的整体平面预测到局部体积预测
该论文提出了一种使用深度图进行 3D 人体姿态估计的新方法,并运用平面网络和体积网络等模型,显著提高了模型的准确性和计算效率。
- Hand3D:使用 3D 神经网络进行手部姿态估计
使用新的 3D 神经网络架构,通过深度图到三维体积表示的转化,直接对手的三维姿态进行估计,无需进一步处理。同时通过合成深度图来增加训练数据覆盖率,在公开数据上达到了最优性能。
- ICCV通过直接体积 CNN 回归从单张图像中重建大规模姿态 3D 人脸模型
本论文提出了使用卷积神经网络(CNN)对具有 2D 影像和 3D 面部模型或扫描的适当数据集进行训练,以实现单个 2D 面部图像的三维面部几何重建,避免了模型建立和拟合的复杂流程,并演示了如何将面部标志定位集成到所提出的框架中,帮助提高重建 - CVPR单视图粗细层次三维人体姿态预测
本研究通过对 3D 人体姿态估计表征问题的认真研究,提出了一种方法,并且对现有的最优解的表现进行了超越,在标准测试基准中相对误差降低超过 30%,该方法包括 Convolutional Network、端到端的学习模型、从粗到细的预测方案和 - FusionNet: 使用多种数据表示进行的 3D 物体分类
利用体素表示法和像素表示法,使用卷积神经网络进行 3D 目标识别。使用新的 V-CNN 架构将两种表示法相结合,获得显著更好的分类器。
- 实时三维体积非刚性重建
通过使用单个消费级 RGB-D 传感器以实时速率进行动态几何形状的重建,我们提出了一种新的方法,该方法不需要预定义的形状模板,并且在扫描过程中从头开始构建场景模型。采用了体积表示法对几何和运动进行参数化,并且基于提取的稀疏颜色特征与密集深度