窗口傅立叶混合器:利用傅立叶变换增强无杂波空间建模
基于全 MLP 框架,WindowMixer 模型通过窗口视角检查时间序列的时间变化,将时间序列分解为趋势和季节性组件,并使用 Intra-Window-Mixer 和 Inter-Window-Mixer 模块处理窗口间和窗口内的关系,从而捕捉数据中的复杂模式和长期依赖关系,实验证明 WindowMixer 在长期和短期预测任务中始终优于现有方法。
Jun, 2024
通过学习可学习的 Hough Transform block 来实现将图像特征从 cubemap tile 转换为曼哈顿世界的 Hough 空间,并直接将特征映射到几何输出,从而预测 3D 空间中的墙壁。
Jul, 2022
该研究论文旨在通过提出的模型从二维场景中提取具有建筑意义的语义描述,通过训练合成生成的图像以及相应的高级建筑结构,使用像素级比较评估,在真实环境中对其性能进行测试和评估。
Dec, 2023
本文提出了基于最新的三维室内布局估计模型的训练和后处理方法,实验结果显示我们的方法在预测可见室内布局方面比现有方法大幅优越,并在 2020 年全面场景结构与 3D 视觉研讨会获得了第三名。
Sep, 2020
本文提出一种解决单视角条件下房间(墙壁,地板,天花板)的三维布局重建问题的新方法,使用离群点检测和优化方法,在处理布局中的遮挡时提高了重建的准确性,同时创建了扫描网数据集以便对方法进行数量化评价。
Jan, 2020
为了解决视频帧预测任务中的连续复杂运动和场景遮挡问题,我们开发了基于全卷积快速傅里叶 Inception 网络(FFINet)的视频预测方法,该方法包括遮挡修复器和时空转换器等两个组件,并将恢复损失纳入目标函数进行模型优化来生成更逼真、高质量的未来帧。
Jun, 2023
通过将低频和高频区域分别表示,并结合图像锐化和去噪技术以及估计像素级表面法线向量的网络,我们的混合架构和改进的正常先验可以显著提高室内场景的重建质量。
Sep, 2023
我们提出了一种新颖的神经隐式建模方法,利用多种正则化策略在仅依赖图像的情况下实现大型室内环境的更好重建,通过稀疏但准确的深度先验将场景锚定到初始模型,并引入一种密集但精度较低的深度先验,灵活性足以让模型从中分离出来改善估计的几何建模,并提出了一种新颖的自监督策略来规范估计的表面法线,最后,可学习的曝光补偿方案适应复杂的光照条件。实验结果表明,我们的方法在具有挑战性的室内场景中产生了最先进的 3D 重建结果。
Sep, 2023
本文提出了一种自动系统,在 3D 场景中移除杂物并填补缺失部位,解决了 3D 分类和 3D 修复两个关键问题,实现了杂物与纹理准确的合成,实验表明该方法在杂物分割和 3D 修复方面都表现优秀。
Apr, 2023
通过引入可学习的空间掩码,将不同频率的傅里叶基函数有效地分配给各个区域,从而实现傅里叶拼贴,并能对复杂信号进行准确表示,该方法在各种 INR 任务中的实验表明,相较于现有基线模型,其重构质量更高,如图像拟合 PSNR 提高了 3dB 以上,3D 重建达到了 98.81 的 IoU 和 0.0011 的 Chamfer 距离。
Dec, 2023