Jun, 2024

GMT:叶片实例分割的引导蒙版变换器

TL;DR本文提出了一种名为 Guided Mask Transformer(GMT)的新方法,其包含了三个关键组件,即 Guided Positional Encoding(GPE),Guided Embedding Fusion Module(GEFM)和 Guided Dynamic Positional Queries(GDPQ),以扩展 Mask2Former 的元架构,并结合一组谐波导向函数。这些导向函数是根据实例的像素位置量身定制的,并通过嵌入空间中训练来分隔不同的实例。提出的 GMT 在三个公共植物数据集上始终优于现有模型。