用于城市街景图像的多尺度语义先验特征引导深度神经网络
本文介绍了使用一种新型的卷积神经网络(MPI)完成语义场景理解中的语义前景修复任务的方法,该方法不需要手动标注背景,并且其比之前最先进的两阶段方法提高了 3% 的 IoU,并在 Cityscapes 测试中表现得更有效率。
Sep, 2019
本研究提出了一种新的图像修复方法,结合了神经网络的先验知识和用户的引导,使用自动编码器和语义解码器完成两个阶段,实现对修复结果的自定义控制,实验结果表明该方法在修复质量和可控性方面优于现有方法。
Jan, 2022
本文提出使用受自我监督预训练的 MAE 方法,作为 inpainting 模型的新骨架,并加入 MAE 注意先验,以增强 inpainting 模型的长距离依赖性,验证结果显示该方法在 Places2 和 FFHQ 上都取得了较好的效果。
Aug, 2022
本文提出了一种用于城市街景的语义分割的高性能深卷积神经网络方法,它实现了精度和速度之间的良好权衡,并展示了在实时速度下使用单个 NVIDIA TITAN X 卡片在具有挑战性的 Cityscapes 和 CamVid 测试数据集上分别实现了 73.6%和 68.0%的 mIoU 精度。
Mar, 2020
利用预训练自然语言模型的新框架,结合街景图像和机器学习,深入理解人类感知和场景感受之间的关系,并发现利用深层语义特征对于人类感知研究的重要性和解释力的提升。
Nov, 2023
该研究提出了一种新的多尺度监督扩张多路径注意力网络(MSSDMPA-Net)框架,其中包括动态注意力映射引导索引池化(DAMIP)和动态注意力映射引导空间和通道注意力(DAMSCA)等两个模块来从卫星图像中精确提取建筑物和道路,并且实验证明其优于现有方法。
Feb, 2023
本研究提出了一种名为 NMP 的神经网络结构,能够自动更新全局地图并改善局部地图推理性能,实现了全局地图先验的初步学习。实验表明,该框架对各种地图分割和检测架构具有高度兼容性,并且即使在恶劣天气条件和较长的预测时间跨度内,也能显著增强地图预测性能。
Apr, 2023
提出一种基于多尺度神经网络贴片合成方法的图像修复算法,通过联合优化图像内容和纹理约束,不仅保留了上下文结构,而且通过匹配最相似的中间层特征相关性,产生高频细节。在 ImageNet 和 Paris Streetview 数据集上,该方法取得了最先进的修复准确性。
Nov, 2016
该论文提出了一种自动移除和修复街景图中运动物体的替代方案,基于多幅彼此连接的街景图像,利用深度一致性以及分割网络的结果,检测出运动物体并进行修复,并在 1000 个图像数据集上取得了较好的峰值信噪比和 L1 损失结果,同时进行了人眼评估。
Mar, 2019