Jul, 2024
LaMI-DETR: 通过语言模型指令进行开放词汇检测
LaMI-DETR: Open-Vocabulary Detection with Language Model Instruction
TL;DR该研究论文介绍了Language Model Instruction (LaMI)策略在图像识别中的应用,利用Vision-Language Models和基于GPT和T5的LaMI-DETR检测器,通过构建视觉概念和分析类别之间的视觉相似性,解决了概念表示不足和过度拟合的问题,且在无需外部训练资源的条件下表现出卓越的性能。