CVPRJun, 2024

探索视觉语言模型的零样本能力以提高凝视跟踪

TL;DR通过调查视觉语言模型(VLMs)的零样本能力,探索提取各种上下文线索以提高凝视跟踪性能的可能性。