Jan, 2025
统一编码:同时满足人类感知和广义机器分析的 CLIP 监督
Unified Coding for Both Human Perception and Generalized Machine
Analytics with CLIP Supervision
TL;DR本研究解决了图像压缩模型在适应性和泛化方面的不足,特别是现有解码比特流仅满足人类或机器需求的问题。论文引入了多模态预训练模型的监督和自适应多目标优化,提出了统一和广义图像编码方法(UG-ICM),实现了对人类和机器视觉的双重支持,并在各类未见机器分析任务中显示出了显著的提升。