BriefGPT.xyz
Ask
alpha
关键词
low-level visual capabilities
搜索结果 - 1
视觉推理与基础合理性:看、记住和推理
该研究旨在通过模仿人类视觉问题解决中的 “看、记住、推理” 模式,引入基于视觉输入的原理来整合低级视觉能力,使现有的大型语言模型能够在视觉推理问题上取得竞争性表现。
PDF
a year ago
Prev
Next