BriefGPT.xyz
大模型
Ask
alpha
关键词
cross-domain evaluations
搜索结果 - 1
AAAI
CLIP-Gaze:基于视觉语言模型的通用注视估计
通过使用预训练的视觉语言模型来提高视线估计的泛化能力,本研究提出了一种名为 CLIP-Gaze 的新型框架。该框架通过在语言描述中构建视线相关特征并将其与视线无关特征相区分,采用个性化上下文优化方法进行文本提示调整,并利用视线样本之间的关系
→
PDF
4 months ago
Prev
Next