BriefGPT.xyz
Ask
alpha
关键词
automated visual assistance
搜索结果 - 1
解释 CLIP 在盲 / 低视能用户数据上的表现差异
大型多模态模型 (LMMs) 在为盲人或低视力用户提供自动视觉辅助方面具有潜力。我们通过实证评估 CLIP,在零样本分类任务中测试了 25 个 CLIP 变体,发现其在盲人用户捕获的图像上的准确性平均低了 15 个百分点,原因是 CLIP
→
PDF
7 months ago
Prev
Next