Dec, 2023

PixelLM:使用大型多模型进行像素推理

TL;DR通过引入 PixelLM,一种高效且有效的大规模多模态模型,该论文解决了对涉及多个开放世界目标的图像推理任务生成像素级掩码的挑战,并在多个基准测试中表现出色,证实了各个组成部分的有效性。