Mar, 2024
MSCoTDet: 基于语言驱动的多模态融合技术用于提升多光谱行人检测
MSCoTDet: Language-driven Multi-modal Fusion for Improved Multispectral Pedestrian Detection
Taeheon Kim, Sangyun Chung, Damin Yeom, Youngjoon Yu, Hak Gu Kim...
TL;DR多光谱行人检测通过引入大型语言模型,融合了视觉与语言信息,提高了检测准确性。