- KDD个性化商品种类选择与实时三维感知及贝叶斯收益估计
现实世界中的产品组合选择是物理零售商面临的一项关键挑战,通过有效地与购物者的喜好相匹配,可以增加销售并减少缺货。为解决这些挑战,我们引入了一个实时推荐系统,利用 3D 计算机视觉和感知技术,以及借助贝叶斯奖励模型、空间聚类和基于图的候选生成 - CVPR随地聆听
通过 DiffRIR 的不同 iable RIR 渲染框架,使用场景的参数化模型,合成具有各种声音特征的新的听觉体验。
- ShapeFusion:一种用于局部形状编辑的 3D 扩散模型
在 3D 计算机视觉领域,参数化模型已成为创造逼真和富有表现力的 3D 头像的突破性方法论。本文利用扩散模型,在完全保留未编辑区域的同时,实现了对 3D 网格的多样化和完全局部化的编辑操作。与现有技术相比,我们的方法在形状操作方面更具可解释 - VEnvision3D:用于三维多任务模型研究的合成感知数据集
开发一个统一的多任务基础模型已经成为计算机视觉研究中的一个关键挑战。本论文介绍了 VEnvision3D,一个用于多任务学习的大型 3D 合成感知数据集,包括深度补全、分割、上采样、场景识别和 3D 重建。对于每个任务的数据在相同场景下收集 - NCRF: 神经接触辐射场技术用于自由视角渲染手 - 物体交互
手 - 物体交互模型是三维计算机视觉中一项根本性的挑战任务。尽管在这一领域已取得了显著的进展,但现有方法仍无法实现逼真的手 - 物体交互合成,因为手和物体之间存在严重的互相遮挡和不准确的姿态估计所导致的渲染质量下降。为了解决这些挑战,我们提 - 可扩展的几何破裂装配:装配者之间的共创空间
发展一种可扩展的几何断裂组装框架,不依赖于语义信息,并且提出了一种新的损失函数来解决断裂组装过程中的碰撞问题并提高结果的性能。
- DatasetNeRF:基于生成辐射场的高效三维感知数据工厂
该论文介绍了 DatasetNeRF,一种新颖的方法,它能够生成无限数量、高质量的与 3D 一致的 2D 注释和 3D 点云分割,同时利用最少的 2D 人工标注。
- 3D-QAE:全量子三维点云的完全自编码
该论文介绍了首个用于三维点云的量子自动编码器,通过在模拟的基于门的量子硬件上进行实验,证明了该方法优于简单的经典基准模型,为三维计算机视觉领域开辟了新的研究方向。
- EAR-Net: 从多视图图像中追求端到端绝对旋转
提出一种基于深度神经网络的 End-to-end 方法,称为 EAR-Net,用于从多视角图像中估计绝对旋转,并在三个公共数据集上表明 EAR-Net 在准确性和速度方面明显优于现有方法。
- Score-PA:基于得分的三维部件装配
本文介绍了一种基于评分的三维部件组装框架(Score-PA)以及一种加速采样过程的新算法(FPC),并通过多种度量指标评估了组装质量和多样性,评价结果显示该算法优于现有的最先进方法。
- E3CM: 基于极线约束的级联匹配算法
准确而鲁棒的对应匹配是各种三维计算机视觉任务的最重要部分。本文介绍了一种名为 E3CM 的新方法,该方法利用预训练的卷积神经网络进行对应匹配,无需任何网络训练或微调的注释数据。E3CM 利用极线约束来引导匹配过程,并采用级联结构进行匹配的渐 - 利用图像增强技术提升神经渲染方法
本篇研究探索了在 3D 计算机视觉中学习神经渲染方法时,引入图像增强技术的潜力和挑战,并提出了一系列的数据增强方法以解决图片几何和光度一致性不足的问题,并说明了数据增强在提高物体重建质量方面的优势。
- 神经辐射场:过去、现在和未来
本篇论文探讨了 Neural Radiance Fields(NeRFs)在 3D 计算机视觉、计算机图形学和机器学习等领域的应用,包括历史、研究进展、潜在应用和影响等方面,并对相关研究进行了分类总结。
- PointCLIMB: 一种无标杆点云类增量基准测试
本文提出了 PointCLIMB 模型,探究了一种在点云数据中使用无样本类增量学习的方法,并在 ModelNet40 数据集上进行了展示。
- 3D-LatentMapper:三维形状的视角无关的单视图重建
本文提出了一种新的框架,利用 Vision Transformer(ViT)和联合图像 - 文本表示模型 CLIP 的中间潜空间,用于单视图重建,通过学习从 ViT 和 CLIP 提取的深度特征与基础 3D 生成模型的潜在空间之间的映射来揭 - AAAINeAF: 学习点法矢量场进行法向估计
本文提出了一种用于三维计算机视觉中非结构化点云数据的法线估计方法 - Neural Angle Fields (NeAF), 使用球坐标系下的隐式函数学习每个点周围的角度场,可以更加鲁棒地推断出所需法向量,并且在合成数据和真实数据上都取得了 - ECCV深度场网络用于多视角场景的通用表示
提出了一种使用 Transformer 架构学习隐式多视图一致场景表示并引入一系列 3D 数据增强技术的方法来增加视角多样性的深度估计网络,同时介绍了引入视角合成作为辅助任务,该网络在不使用显式几何约束的情况下在立体和视频深度估计方面取得了 - CVPRPrimitive3D:从随机组装的基元中合成 3D 对象数据集
本研究提出一种成本效益高的方法,通过组装多个随机基元来合成自动带有部件标签的 3D 对象,从而生成大量带有标注的数据集,并通过数据集蒸馏策略来移除冗余样本,实现了在生成数据集上进行监督分割与无监督重建的多任务学习。实验结果表明,该方法相对于 - RGL-NET:一种递归图学习框架,用于渐进式零件组装
本文提出了一种基于递归图学习的自主组装物体的新方法,通过考虑零件之间的相互关系和部件姿态的逐步更新,实现了对具有结构变异的物体的组装。该网络在 PartNet 数据集上相对于现有技术实现了 10% 的部件精度和 15% 的连通性精度的提升, - CVPRReAgent: 点云配准的模仿和强化学习
本篇论文提出了一种基于强化学习的点云迭代配准算法(ReAgent),通过引入一个新的对齐奖励函数进行多策略融合优化,显著提高了算法的配准性能,实验证明该算法在 ModelNet40 和 ScanObjectNN 数据集上均具备优秀的性能,在