BriefGPT.xyz
Ask
alpha
关键词
gaze information
搜索结果 - 2
COLING
基于凝视的视觉问答数据集用于澄清模糊的日语问题
通过利用注视信息澄清有歧义的问题,我们提出了以注视为基础的视觉问题回答数据集 (GazeVQA),并提出了一种利用注视目标估计结果提高 GazeVQA 任务准确性的方法。实验结果显示该方法在某些情况下提高了 VQA 系统在 GazeVQA
→
PDF
3 months ago
Voila-A: 用户注视注意力对齐视觉语言模型
本文介绍了一种使用视线信息作为人类关注的代理来指导视觉 - 语言模型(VLMs)的方法,提出了一种名为 Voila-A 的新方法,通过目光对齐增强了这些模型在现实应用中的可解释性和效果,实验结果表明 Voila-A 显著优于几个基准模型,为
→
PDF
6 months ago
Prev
Next