介绍了一种用于 360 度图像的单目表面法线估计架构 PanoNormal,通过使用多级全局自注意机制和考虑球面特征分布,结合了 CNN 和 ViTs 的优势,实现了在多个流行的 360 度单目数据集上的最先进性能。
May, 2024
本文提出了一种多模态空间矫正器解决自我中心图像中景深和表面法线预测的挑战,同时提出了一个新的数据集 EDINA 并使用多模态空间矫正器进行单视角深度和表面法线预测,在常见的自我中心图像数据集上优于基准模型。
Jul, 2022
利用感知偏置进行表面法线估计,采用像素级射线方向并学习邻近表面法线之间的相对旋转关系,可以在任意分辨率和长宽比的复杂野外图像中生成鲜明但分段平滑的预测,且该方法具有较强的泛化能力,即使训练数据集规模比最先进的 ViT 模型小几个数量级。
Mar, 2024
提出了一种基于自动矫正网络的数据预处理方法,解决了手持场景下旋转运动对单视角深度估计的干扰问题,并针对不同数据集验证了该方法的有效性及通用性。
Jun, 2020
使用 Transformer 从带有噪声和密度变化的点云中准确预测法线,在合成形状数据集 PCPNet 和真实世界室内场景数据集 SceneNN 上实现了最先进的性能,表现出更强的抗噪性和显著更快的推理速度,同时证明了现有工作中的复杂手工设计模块在表面法线估计任务中并非必需。
Jan, 2024
本文提出了一个针对光度立体问题的不需要校准的深度神经网络框架,通过估计输入图像的光线方向来计算表面法线、双向反射分布函数值和深度,同时显式模拟图像形成过程中的凹凸面部分的互反射效应,结果表明该方法在挑战性主题上表现优于监督和经典方法。
Dec, 2020
本文提出的新型网络方法能够识别出单个图像中的表面法线概率分布,通过使用不确定性引导的抽样技术减少数据集倾斜,并显著提高预测的准确性与精细度。
Sep, 2021
该研究提出了一种基于图神经网络和自适应各向异性核的表面法线估计算法,不需要任何手动特征或预处理,优于现有深度学习方法,在保留尖锐特征和空间等变性的同时,速度和参数效率均为同类算法的两个数量级。
Apr, 2019
UprightNet 是一种学习方法,通过使用几何推理,从单张室内场景的 RGB 图像中估计相机的 2DoF 方向;该方法中包含了一个神经网络,可以在两个不同的坐标系中预测场景的几何表示,并通过可微的最小二乘模块解决相机定向问题,从而实现了端到端的训练并且在合成和真实数据集上实现了明显的优化。
Aug, 2019
通过使用一阶微分特性 (即,表面法线),本文展示了训练神经表示形成高准确度的 3D 表面重建,即使只有两个 RGB 视图可用,极大地改善了以前难以捕捉的复杂几何细节和薄结构。
Jun, 2024