Nov, 2023

结合以语言驱动的外观知识单元和视觉提示的行人检测

TL;DR通过将大型语言模型与视觉线索相结合,我们提出一种新的方法来理解语境外观变化并将其知识应用于行人检测任务,通过与大量描述行人外观的叙述语料库结合,提取代表外观变化的知识集合,并通过任务驱动的过程获得与行人检测相关的外观知识单元,最终实现与视觉线索的融合,从而提供丰富的外观信息,并验证了该方法的有效性。