Mar, 2024

MSCoTDet: 基于语言驱动的多模态融合技术用于提升多光谱行人检测

TL;DR多光谱行人检测通过引入大型语言模型,融合了视觉与语言信息,提高了检测准确性。