多边形生成器:一种自回归建筑物轮廓划分工具
本研究研究了 Transformers 生成预测的两种方法:自回归和并行预测,并在视觉集预测任务中以多边形图像为例,提供了有关 Transformers 自然顺序重要性的证据,表明将复杂的多边形分解为点的集合可以获得自回归方式的好处。
Aug, 2021
该论文提出一种基于序列多边形生成框架 Polygon Transformer (PolyFormer) 的图像分割方法,通过生成多边形顶点序列实现对图像分割的参照。该方法在 RefCOCO+ 等实际数据集上表现优异,性能提升明显。
Feb, 2023
从遥感图像中提取建筑轮廓是一个重要的挑战,本文介绍了一种新的流线型流程以无需后处理生成规则的建筑轮廓,使用分割通用几何图元并预测它们的顺序,在此基础上,开发了一个利用 Transformer 架构的 P2PFormer,通过引入群体查询的独特表示方法,结合创新的内隐更新策略,提高了图元分割的质量,实验证明 P2PFormer 在多个数据集上表现优于先前的方法。
Jun, 2024
深度学习方法在遥感影像中自动建筑物映射方面得到广泛研究。本文提出了一种简单且新颖的基于 Hierarchical Transformers 的建筑物映射方法 HiT,通过增加一个多边形头并行于分类和边界框回归头的两阶段检测结构实现了从高分辨率遥感影像中提取多边形建筑物的质量改进。经过包括分割、多边形化和正则化在内的一系列问题的分解,传统的建筑物映射方法常常导致复杂的推断过程、低准确率和差泛化能力。HiT 同时输出建筑物边界框和矢量多边形,并进行端到端的训练。多边形头采用编码 - 解码的 Transformer 架构来预测带有双向特点的序列化顶点,采用设计的双向多边形损失进行监督。此外,多边形头的编码器引入了分层注意机制和卷积操作,提供了顶点和边界级别的更多几何结构。在 CrowdAI 和 Inria 两个基准数据集上的综合实验表明,与现有技术方法相比,我们的方法在实例分割和多边形度量方面达到了最新的良好结果。此外,定性结果验证了我们的模型在复杂场景下的优越性和有效性。
Sep, 2023
PolyMapper 是一种新的方法,用于从空中图像中直接提取城市的拓扑地图,并提出了一种新的序列化方法以实现不同类型对象的统一形状表示,其能够在现有大规模数据集上以全自动方式绘制建筑物和道路的多边形,表现得很好。
Dec, 2018
本文提出了一种基于机器学习的方法,通过数字表面模型和全色影像的输入,使用条件生成对抗网络筛选出非建筑物,然后借助于语义分割网络检测出建筑物屋顶的边缘和角点,并提出一组矢量化算法来构建屋顶多边形,最终从改进后的表面模型中添加高度信息,以获得完全矢量化的精细建筑模型。在大型卫星图像上对我们的方法进行了验证,并取得了最先进的性能。
Apr, 2021
本文提出了一种半自动化的物体实例注释方法,通过多边形预测任务将对象分割,使人类标注者能够随时进行干预和纠正,从而实现更快速、更准确的注释过程。
Apr, 2017
这篇论文通过使用 CNN 和 IP 算法,从单一 RGB 图像中推断出室外建筑物的 2D 平面图结构,取得了显著的结果,并提出了可供分享的代码和数据。
Dec, 2019