pixel-level alignment | BriefGPT

关键词pixel-level alignment

搜索结果 - 4

探索简化开放词汇语义分割
通过 S-Seg 模型，我们可以实现准确的像素级别标签分配，无需依赖于图像级别的 VL 模型、地面实况掩码和自定义分组编码器，并且可以在多个测试数据集上进行良好的泛化而无需进行微调。
PDF5 months ago
ICLR敌对监管使布局到图像扩散模型蓬勃发展
通过在传统的布局到图像扩散模型的训练过程中引入对抗监督，我们提出了一种布局到图像综合模型。该模型通过基于分割的鉴别器提供像素级对齐的显式反馈，以实现生成图像与输入布局之间的强对齐。通过引入多步展开策略，我们进一步鼓励模型在采样步骤中始终与输
PDF6 months ago
TMP：在线视频超分辨率的时域动作传播
提出了一种高效的时间运动传播（TMP）方法，利用运动场的连续性实现连续帧之间的快速像素级对齐，通过先前帧的偏移向当前帧传播，并在邻域内进行进一步调整，同时对扭曲特征进行空间加权，以增强对齐的鲁棒性。
PDF7 months ago
ECCV身份引导的人体语义分割用于人员再识别
本文提出了一种基于身份指导的人类语义解析方法（ISP），通过级联聚类来生成伪标签，并仅利用人的身份标签来定位人体部位和个人物品并实现像素级别的对齐，最终从中获得人体部位和个人物品的本地特征，验证表明，该方法在三个被广泛使用的数据集上优于大量
PDF4 years ago