- GOV-NeSF: 通用开放词汇神经语义领域
通过引入 Generalizable Open-Vocabulary Neural Semantic Fields (GOV-NeSF),我们提出了一种对 3D 场景进行泛化的隐式表示方法,显著提升了 2D 和 3D 开放词汇语义分割的性能 - FlexiDreamer:使用 FlexiCubes 的单图像生成 3D
通过灵活的基于梯度的提取方式(FlexiCubes)以及逐步优化的多分辨率哈希格网编码方案,FlexiDreamer 能够在约 1 分钟的时间内从单视图图像中恢复出密集的 3D 结构,并在单个 NVIDIA A100 GPU 上远远优于之前 - DVN-SLAM:基于局部 - 全局编码的动态视觉神经 SLAM
基于局部 - 全局融合神经隐式表示的实时动态可视化 SLAM 系统 (DVN-SLAM) 能够提高场景表示能力、处理渲染过程中的不确定性,并在多个数据集上实现了竞争性的定位和映射性能,在动态场景中表现出鲁棒性,这是与其他基于 NeRF 的方 - ICLR学习隐式表示以重建关节式物体
利用物理约束为我们建立的隐式表示提供了规范项,通过迭代估计隐式和显性表示,我们证明了我们的方法在标准视频数据集上优于现有技术。
- ElasticLaneNet:一种灵活的几何方法进行车道检测
通过新的弹性交互能量引导车道检测网络(ElasticLaneNet)框架,采用隐式表示的新颖灵活方式,以及基于弹性交互能量的损失函数(EIE loss)引导下的训练策略,结合辅助特征细化模块(AFR),该方法在复杂车道场景中表现出色,并在三 - GauHuman: 单目人体视频的关节高斯粒子渲染
GauHuman 是一个 3D 人体模型,通过高斯飞溅实现快速训练(1 ~ 2 分钟)和实时渲染(最高 189 FPS),与现有的基于 NeRF 的隐式表示建模框架相比,后者需要几个小时的训练和每帧几秒钟的渲染。
- SAIR:学习语义感知的隐式表示
我们提出了一种语义感知的隐式表示方法(SAIR),其将每个像素的隐式表示分别依赖于其外观和语义信息(例如,像素属于哪个对象)。我们的实验证明,该方法在图像修复任务中超越了现有方法的显著优势。
- ICCVS3IM:随机结构相似性及其对神经场的非理性有效性
我们设计了一个非局部多路训练范式,通过一种新颖的随机结构相似度 (S3IM) 损失方法,将多个数据点作为一个整体集合处理而不是独立处理多个输入,从而改进了 NeRF 和神经表面表示,而且在稀疏输入、受损图像和动态场景下具有稳健性。
- 神经流函数
本文提出了一种使用神经网络计算流函数的方法,并介绍了使用该方法可视化流场及分析流动特征的流面,其中网络的损失函数可以选择以流线曲率为约束条件来获得特定的流函数解,详细探讨了训练后提取流面的方法,并提出了与其他隐式解决方案的对比和结果。
- 使用隐式表示学习进行 3D 关键点估计
本研究采用新颖的隐式表示方法解决了通用物体的 3D 关键点估计问题,通过使用球来表示 3D 关键点,以此实现对应的带符号距离场的可学习性,并基于 Hough 变换后提取出显式的关键点。实验结果表明,该表示方法在预测精度方面具有优越性。
- CVPR基于参数隐式表征的音频驱动面部再现
本文提出了一种新的音频驱动面部再现模型,通过参数化隐式表达,同时采用了正式及隐式表达的优点,采用了多种技术来提高其质量,成功解决了可控性与高质量之间的平衡问题
- 针对语义任务的隐式表征语境化
本文提出一种语境化的方法,可以在不需要访问原始训练数据或编码网络的情况下,将专门用于重构的隐式表示的编码用于语义任务,揭示了编码中隐藏的有意义的语义信息,并通过在大型数据集上预训练隐式表示,同时保持在标签数据集上的附加分割和重构的性能,并允 - CVPR基于神经投票场的相机空间三维手部姿态估计
通过基于 3D 隐式表示的单个 RGB 图像的相机空间 3D 手势估计的统一框架,我们提出了一种新颖的 3D 密集回归方案,该方案通过相机锥体内的密集 3D 点投票来估计相机空间 3D 手势。
- 神经小波扩散用于 3D 形状生成、反转和操作
本文提出了一种基于连续小波嵌入式表示的 3D 形状生成、反演、操纵方法,包括紧凑的小波表示、扩散生成器、细节预测器、编码器等,实现了较为强大的形状生成、反演、操纵能力,优于现有的最新方法。
- ECCVPS-NeRF:基于神经网络的多视图光度立体反演
本研究提出了一种基于神经反演渲染的多视角光度立体(MVPS)方法,能够同时估算几何形状、材料和光源,并且在人工渲染、再照明和材质编辑方面具有较高的精度。
- 平面与椅子:无需任何 3D 提示的类别导向的三维形状学习
本文提出了一种基于单个 RGB 图像学习预测隐式 3D 物体形状表征的新型 3D 形状重构方法,使用多种无视角注释的单视角图像进行跨类别学习且仅使用标签进行监督,辅以分类度量学习与对抗性和视点正则化技术,取得了 ShapeNet-13,Sh - RangeUDF: 从 3D 点云中语义表面重建
本研究提出了 RangeUDF 框架,使用基于隐式表示的方法从点云中恢复连续 3D 场景表面的几何和语义,通过表面导向的语义分割模块和范围感知的带符号距离函数,实现了连续表面的语义建模和重建,并在多个点云数据集上比较实验表明,该框架明显优于 - CVPR人形化建模的结构局部辐射场
使用基于神经场景渲染技术的新型表示方法,将结构化本地辐射场锚定到人体模板节点上,将服装变形分解为骨架运动、节点残差翻译和每个辐射场内的动态细节变化,支持各种服装类型的自动构建可动画人形化身,并在新姿势下生成真实的动态细节图像。
- 综合位置编码增强图像超分辨率中的多尺度隐式学习
本文通过将频率信息聚合在像素区域中来扩展传统的位置编码,提出了集成位置编码(IPE),并将其应用于最先进的任意尺度图像超分辨率方法之一:局部隐式图像函数(LIIF),提出了 IPE-LIIF。我们通过定量和定性评估展示了 IPE-LIIF - OctField: 用于 3D 建模的层次隐式函数
本文提出一种可学习的、分层的隐式表示方法 OctField,通过引入一种自适应的八叉树结构,可以将离散的、可递归编码的八叉树结构和表面几何以可微分的方式编码和解码,从而优于其他方法在一系列形状建模和重建任务中展现了其价值。