- 手持物体单目图像的隐式重建中学习显式接触
本文提出了一种新的方法,通过建模手部与物体之间的互动模式,达到更准确、更真实的物体重建,包括手部接触物体的部分。该方法由两部分组成:显式接触预测和隐式形状重建,并在挑战性数据集上表现出比当前艺术水平更出色的性能。
- CVRecon: 重新定义神经重建的 3D 几何特征学习
提出了一种基于多视角立体技术的神经重建框架 CVRecon,使用创新的 3D 几何特征表示方法 RCCV,可以显着提高三维几何重建质量和恢复细节。
- Occ3D:面向自动驾驶的大规模三维占据预测基准
本研究提出了一种新的 3D 占据预测任务,旨在从多视图图像中估计对象的详细占据和语义信息,并介绍了 Coarse-to-Fine Occupancy (CTF-Occ) 网络模型,该模型在 3D 占据预测任务中表现出优越的性能。
- 分子图结构共设计等变生成框架
通过 MolCode 的 roto-translation equivariant 模型,结合 2D 拓扑和 3D 几何信息,不仅可以成功设计出 99.95% 有效性和 98.75% 独特性的分子结构,同时还能帮助发现高亲和力的小分子靶向药 - CVPRARKitTrack:一种利用移动 RGB-D 数据进行跟踪的新多样化数据集
本论文提出 ARKitTrack 数据集,包含 300 个 RGB-D 序列,455 个目标,总计 229.7K 个视频帧和 123.9K 像素级目标遮罩,并提供每个帧的相机内参和相机姿态信息。此外,研究人员还提出了一种新的跨模态 3D 几 - CVPR透过玻璃看到内部物体的神经网络三维重建
本文提出了一种解决通过透明封装的对象恢复三维几何形状的新方法,将场景显式建模为内外两个不同的子空间,并使用了一种混合渲染策略,通过最小化真实图像与混合渲染图像之间的差异来恢复模型的几何形状和外观,实验证明该方法优于现有的技术。
- WWWNeTO: 自遮挡感知的折射追踪技术用于透明物体的神经重建
NeTO 是一种通过体积渲染的,利用带有自遮挡感知的折射光线跟踪优化带隐式符号距离函数(Signed Distance Function)表面表示的方法,能够重建高质量的透明物体三维图像,且在正确重建自遮挡区域方面表现优异。
- VoxFormer:基于摄像机的稀疏体素变换器用于三维语义场景完成
本论文提出了一种基于 Transformer 的场景语义补全框架 VoxFormer,可以从 2D 图像中输出完整的 3D 体素语义,并在测试中获得了相对 20% 的几何和 18.1% 的语义方面的提升。
- 城市驾驶的基于模型的模仿学习
使用基于模型的模仿学习方法来提高自主驾驶的动作规划,该方法利用 3D 几何形状作为归纳偏差并从专家演示高分辨率视频中直接学习高度紧凑的潜在空间。该模型被训练于城市驾驶数据的离线语料库中,是首个在城市驾驶环境中只使用相机模拟出静态场景、动态场 - ICLRDM-NeRF:从 2D 图像中分解和操作 3D 场景几何形状
本研究利用迄今为止最新的神经辐射场技术,通过引入物体场组件从 2D 视野中学习 3D 空间中所有个体物体的独特代码,并引入反向查询算法以自由地操作学习场景表示中特定的 3D 物体形状,进而解决物体碰撞和视觉遮挡等关键问题,能够准确地从 2D - ECCV2D GANs 遇见无监督单视角 3D 重建
提出了一种新的基于图像的神经隐式场方法,该方法利用基于 GAN 生成的多视图图像的 2D 监督,并通过不确定性模块来提高重构性能,从而实现了泛化物体的单视角 3D 重构。
- AAAI基于能量激发的等变预训练对 3D 分子图的研究
本文提出一种新的三维分子预训练方法,该方法采用等变能量基模型作为主干网络,以预测节点力信息为目标进行节点级预训练损失计算,并采用高斯分布以保证其 E(3)不变性,同时通过图层级噪声缩放预测任务来进一步提高模型性能,实验结果表明,该方法在两个 - 使用 SE(3)不变去噪距离匹配进行分子几何预训练
提出了利用 3D 几何结构进行预训练的方法,并提供了一种 3D 坐标去噪预训练框架以建模分子的平滑势能面。实验验证了该方法的效果和稳健性。
- ECCV无监督学习高效的几何感知神经关节表示
该研究提出了一种基于生成对抗网络(GAN)的无监督 3D 几何感知表征学习方法,成功地实现了对复杂关节动态物体的控制性 3D 表征的学习,同时避免了传统方法需要用昂贵的标注数据,在实践中具有较好的效果和效率。
- CVPR单张图像纹理三维模型的视角推广
本研究介绍了一种模型,可以在降低模型的偏差的同时提高模型的方差,从而解决计算机视觉中物体单视角的外观推理问题,并加入循环一致性损失来提高视角泛化性能以及纹理对齐,与现有的最先进方法相比,我们的方法在定性和定量方面均有所提高。
- ICLR具有隐式位移场的几何一致性神经形状表示
本文介绍了一种新颖的隐式位移场在 3D 几何形状的表达及重构中的应用,它将一个复杂的表面表示为一个平滑的基础表面及一个沿着基础表面法线方向的位移,实现了高低频信号的分解,提高了表达能力、训练稳定性及泛化性。
- ICML可操纵的 3D 球形神经元
该论文提出了一种可定向前馈的学习方法,利用球面神经元对点云进行分类,得到具有旋转等变性的滤波器组建网络,利用三角形基础来推导滤波器并构建旋转等变性的球形滤波器组。
- 移动 SLAM: 弹性场景中全无监督深度学习
该研究提出了一种基于深度学习的方法来将视频分解为三维几何(摄像机和深度)、运动物体和它们的运动,其中没有监督。通过最小化合成图像和对应真实图像之间的误差,可以完全无监督地训练预测姿态和深度的深度网络,同时在图像的小区域内预测不同的姿态,实现 - 通过 3D 分解进行人脸伪造检测
本文提出了一种将人脸图像分解为 3D 几何形状、贴图和光照的计算机视图,使用人脸细节结合直接光和身份贴图来检测微妙的篡改模式并实现了最先进的性能表现。
- 利用本地深度隐函数对 LiDAR 数据进行语义场景补全
本文提出了一种新型的场景分割网络,基于本地 Deep Implicit Functions 的方法,用于语义场景补全,并将其在经过语义注释的 LiDAR 扫描上验证了其性能的优越性。